ここでご紹介するのは大塚流の電子辞書の使い方です。大塚の遍歴を絡めて思考錯誤のメモとして残し、皆様に再利用していただければこれに勝る幸せはありません。最後の部分の辞書への読み仮名の導入などはおそらくあまり人のやっていない部分だと思います。
詳しい導入方法がお知りになりたい方はこちらへでも書き込んでください。
発端
1997年年末のこと。モバイルギアMC-MK12を購入したのがきっかけです。このいわゆる「DOSもば」を購入した理由は
- 出先文書入力用として
- 出先通信環境として
- 海外に行くときの辞書として
でした。始めの文書入力用として考えると、ほとんど選択肢はありません。HP-200LXが対抗でしたが、実売の値段が大きく差があったので。
この「DOSもば」、本体自体に各々5万語程度の英和と国語辞書がついていまして、デイリーコンサイズ代わりに利用することにしたわけです。もっとも、この理由はかなり薄かったです。なぜなら「DOSもば」はDOS環境では、英和辞典も国語辞典も利用することができませんでしたから。辞書データの解析と、リアルタイムデコードライブラリの利用の仕方がわかり、mgedicのβ1がリリースされたのが98/02/16です。
PDICとの出会い
ところが、英和辞典だけではなく、和英辞典も使いたいと思うようになるのが人情。FNECMCの10番会議室の過去ログをあさってPDICに行き当たりました。TaNさん作成によるPDICとの蜜月時代はその後長く続きます。
辞書データとして当初導入していたのはPDIC用辞書・1995年5月版 基本セットでした。確か「DOSもば」の達人、岡田元次さんの記事を読んで見よう見まねで導入したのがきっかけです。始めは英和辞書のみ作成して和英は本文検索で代用していたものです。何せPCMCIAカード40Mの中古が4万円ほどしたのでつめて使ったものです。
「DOSもば」の利点CPU速度の変更もPDIC起動時には使用できませんし、PDOUTを利用するとインクリメントサーチが出来ないので打ちそこないに厳しく、起動コマンドをいちいち足さなければならないのもめんどくさく、結局和英辞書を添付のPDUTYから作成して利用しました。
英辞郎との遭遇
知人の韓国人から、英辞郎の話を聞き、ダウンロードしたのが98年夏ぐらいだったと思います。
当初あまりの大きさに、まさか「DOSもば」に導入できるとは考えもしませんでした。
が、PDOUTとPDUTYを駆使して熟語見出しを切り落として12万語程度の辞書を作成して、英和和英とも「DOSもば」に導入することができました。
ポーランド語辞書の作成
仕事で1998年の秋に一度ポーランドに行き、そこでポーランド語-英語のポケット辞書を購入してきました。1999年、ポーランドに1年行くことが決まったので、その辞書を「DOSもば」にPDICを利用して入力しつつ、日本語をつけていくという作業を開始したのが、1999年春のことです。結婚したばかりのかみさんにも手伝わせて、夏にポーランドに移り住むまでに7000語を入力して始めの版としました。
ドイツ語、ロシア語
実は第二外国語、第三外国語として各々取っていたことがあり、ネットを探しまわった末、ドイツ語はJoe's HomePageとLonly Foxからあわせて5万語程度、ロシア語はもはやリンク先がなくなってしまいましたが、やはりネットから1万語程度入手することが出来ました。
マイペディアPCSuccess版
日本から遊びにくる、かみさんの知人に頼み込んで128MのCFと、マイペディアPCSuccess版を購入してきてもらったのが2000年の初めです。
マイペディアPCSuccess版はniftyのFHPPCで話題になり、何とか手に入れたいと思っていた矢先、かみさんの知人でPCに詳しい人が遊びにくるという、渡りに船の状態で手に入りました。
この時点で英和、和英、ドイツ語、ロシア語、百科事典マイペディアが手に入りました。英和、和英はCFが大きくなったので、英辞郎、和英辞郎をDOS版の縛り300文字程度に適当に分割して導入することが出来ていました。また、ポーランドで手に入れたポ英の辞書も無理やり「DOSもば」へデータコンバートして、ポ英で引いて英和を引いてポ和を作る日々が続きました。
英辞郎のデータコンバート
英辞郎そのままだと、大文字小文字の制約を受けているので、適当なフィルタで一旦見出し語を全部小文字にしたバージョンを作成して使用しています。もちろん、元の見出しは[]付けで残してあります。
理化学辞典
FHPPC、FNECMCでEPWING形式の辞書の導入がはやっていたとき、重くて持ってこられなかった理化学辞典が版を新たにCD-ROMで登場しました。そこで、今度はかみさんのお姉さんにお願いして、ポーランドまで買ってきてもらいました。2000年夏のことです。
例によって岡田元次さんのdicmgによって、下付きや上付き文字等が「DOSもば」上で再現された辞書が、遠いポーランドの地で使えるようになったのです。
広辞苑の導入
ここまででEPWING辞書まで読めるようになったのをいいことに、広辞苑の導入まで手を広げました。残念ながら手に入ったのは電子辞書版の4版でしたが・・・。やはり2000年夏の話。
jamへの移行
さすがに手狭になったので辞書の取捨選択を迫られましたが、やはりFHPPCで話題になっていたjamを「DOSもば」へ導入してみました。->これは多分私が一番早いんじゃないでしょうか。
カードブートして、configをいくらか書き換えねばなりませんでしたが、非常に使いやすい環境が出来ました。このとき使っていた英辞郎のVer.38をpdicで利用するとjamのせいかindexを読み込むのにひどく時間がかかってしまうため、自作のソフトを作成して利用することにしました。インクリメンタルサーチが無くなりましたが、ひとつの辞書も手放さずに実現した、それなりに快適な環境でした。2000年秋ごろの話です。
namazuによる広辞苑の逆引き
デスクトップで利用していたDDwinの全文検索で、「規則」と「定める」のand検索がどうもうまくいかないので、いっそのことと思いDDwinでテキストに落としてnamazuにかけてやりました。web上に逆引き広辞苑が無いので、とても便利な環境になりました。2002年春のことです。
和ポ辞書の日本語の読み
PDICで和英辞書を作成すると、当然ながら、登録された漢字表記でしかインデックスが作成されません。そうすると、日本語が読める環境だが、かけない場合に検索することが出来ませんし、ポーランド人が検索するときに使えないことになりそうです。そこで仕事で使用する必要があったjumanという形態素解析ソフトで、漢字の読み方が出力されているで、ポーランド語辞典に読み仮名を振ってみました。
問題は見出しが文章ではないので、切り間違えや読み損ねが頻発してしまっています。(「朝」には「ちょう」という読みがついている^^;。)
ついでなので、適当なプログラムを作成してローマ字の読みまで当ててみました。出来上がったものをFreeのCGIが使えるサーバ上で公開したのがポーランド語オンライン辞書です。2002年春のことです。
和英辞書へのひらがなによるインデックスの付与
上記がうまくいったので、英辞郎を利用した和英辞書にも読み仮名をつけました。適当なscriptとEBstudioのおかげで読み、表記形すなわち漢字による検索が可能になりました。ついでだからローマ字もと思いましたが、前方一致インデックスを3種つけることは出来ないようです。これが正確に可能になれば、FEPのオンオフで悩む必要がなくなるんですがね。
英辞郎にも大文字混じりでも小文字でも検索できるように出来るんじゃないでしょうか。試してませんが。
電子ブック漢字インデクサ
知らないうちに上記のようなものが出来ていました。先ほどの話とは逆で、ひらがなからしか引けなかったものに漢字のインデックスをつけられます。(01/10/26)公開だそうですからそう昔ではないみたいです。これで、電子ブック版広辞苑がEPWING版と同じぐらいの機能になり、漢和辞典としても使えるようになりました。
マイペディアPCSuccess版のEPWING化
上のものと同じページですが、PCsuccess版をhtml形式に、しかもマルチメディア機能も生かしたまま移行するためのソフトが置いてあります。これとEBstudioでEPWING形式のマイペディアが作成できました。
psion5mxへ
ついに「DOSもば」の液晶画面がいかれだしました。手元にはMK12とMK32の両機種がありますので、画面の移植をすればまだ使えます。
しかしながら、知人からpsion5mxを買わないかとの話を持ちかけられ、結局購入してしまいました。使い勝手はいまいちですが、ポケットに入れて持ち歩ける点が「DOSもば」との最大の相違でしょうか。
pB
psion5で使えるepwing辞書引きのソフトです。説明書になかった、ctrl+UでのUnifep越しの漢字入力で、十分使えます。理化学辞典と、広辞苑がこのソフトの恩恵を受けています。
comptdic
厄介なのは英辞郎の方で、xtmというpsion5用のXT機のエミュレータを利用してjamを利用できないかと考えましたが、見事だめでした。
仕方がないので再度自作ソフトに圧縮機能を付け足して作成したのがこのソフト。といっても圧縮と伸張はlha(とlhe)任せですが。xtmによる日本語dos環境では表示が遅いので伸張に必要な時間はあまり考える必要ないみたいです。今のところバッチでいちいち呼び出すようになってますが、そのうち対話型になるようにしたいと思ってはおります。
前述のEBstudioを使えばpBで検索できる辞書が作れますが、元のテキストよりも大きくなってしまうのが難点です。
現在使っているのがver.46.8で95万語ぐらいですか。
tomeraider
辞書ソフトというよりは複数ブックマーク添付機能付きviewerというところでしょうか。psion5上でutf8で作成した文書であれば、ちゃんと表示も検索もできます。が、quick searchがunifepからの入力を受け付けず、ハングするので結局導入には至らず。
探し物
psionで動くsjis対応のgrepを探しています。出来ればコマンドラインの方が良いですが・・・・。
また、psion用のpimソフトで
- 一項目に長文入力が可能なこと
- 日本語入力が可能なこと
- 日本語での検索が可能なこと
- テキストファイル出力が可能なこと
を満たしてくれるものを探しています。agendaでは長文(改行含む)はwordでの添付しか出来ませんが、添付するとその中の検索をagendaからはしてくれません。実験の結果をメモにして残していますのでこれがないと困るわけです。また、別ソフトに食わせるためにもテキスト出力が必要です。現在はDoDiaryを用いて、検索して一括テキスト出力を多用しています。お小遣い帖までつけてますし。