トップ 辞書詳細 画面例 ダウンロード セットアップ フォント設定 検索方法 検索方法2 検索方法3 問題点 その他
EPWING for the classics
その他
ご意見などは
間違い、疑問点、改良点などにお気づきの際は、ぜひこちらの掲示板へお気軽に投稿してください。
今作業中・作業予定のもの
2013/11/29現在。
- [2013/04/06追記] 継ぎ足しだらけでゴチャゴチャになってしまったこのサイトを整理したい・・・・。当初はこんなにあれこれ手を出すつもりは無かったのですが・・・・
- [2012/04/29追記] Project Zephyrで公開
研究社羅和辞典(改訂版)CD-ROMのEPWING化+変化形見出しとの合体
- [2013/11/29追記] アラビア語ページ参照。
Perseusにあるアラビア・英語辞典のEPWING化
- ラテン語変化形データの完全性チェック。データ補完。Lewis&Shortの主見出しの内、約2万5千語がWORDSには無い。固有名詞などがかなり漏れているようだ。どこまで追加すべきか?
- Perseusにあるラテン語・ギリシャ語テキストをまとめたラテン語パック・ギリシャ語パックの作成
- LSJの細かな修正確認
- [2015/02/21追記] 公開しました。
[2012/12/22追記] OED ver.4 CD-ROMのEPWING化。全自動全文コピペ方式だと約24時間かかりました。ただ必ず途中で失敗するので数回繰り返す必要があります。また、コピペだと斜体指定などが全て無くなってしまうので、実用上の問題もあります。
- [2012/12/22追記] グリム兄弟『ドイツ語辞典』(DWB)のEPWING化。ここに全文テキストがあります。全項目ダウンロードしたら、データの欠落がいくつかありました。XMLデータのタグもかなりおかしいところが多く、機械処理がすんなり行きません。
出来たらいいなと思っていること
あくまで「出来たらいいな」であって、作るかどうかのお約束は出来ません。時間や技術的な理由で出来ないこともあります。
- [2013/04/06追記] 新規公開しました。
[2012/12/22追記] 源氏物語のEPWING化。全文テキストはここにありました。日本人ですから日本の作品を避けて通るわけにはいかないかな(読めもしないインド・ヨーロッパ語族の語源を探るくらいなら)、と。
- EBViewのUnicode対応
- Unix環境のEPWINGビューワーとしては、オープンソースのEBViewが定番のようですが、かなり前に開発が止まっています。Windows, Mac, iPhoneにはUnicode対応ソフトがあるか開発中なのに、Linux環境だけ取り残されてしまいます。なんとか出来たらいいのですが。
- [2009/10/1追記] EBViewの作者にメールで伺ったところ、なんと久々に開発作業中とのことです。しかも外字のUnicode表示についても、前向きに受け止めてもらえました。次のEBViewではサポートされるかも知れません。
- [2010/11/23追記] 1年ほど経ちましたが、残念ながら更新版は出ていません(お忙しいとのことでしたが・・・)。
- アラビア語・英語辞書のEPWING化
- Gaffiot(1934)のEPWING化
- 古いGaffiotは著作権保護期間が過ぎていて、dicfroで全ページ画像が公開されています(元はここのmImg.lzhのようで、モノクロ400dpiのtiffファイルが1729枚、245MBあります)。
- もちろんフランス語もさっぱり分かりません。
- [2010/01/10追記] 「挿絵だけ」図鑑の試作品を公開しました(ダウンロードページ参照)。同じ内容をこちらでもご覧頂けます(注意:画像が大量にあります)。
- [2010/04/05追記] なんと、こちらのサイトで、テキスト化作業が進んでいます。2009年で1/3ほど済んだようなので、このペースならあと2年くらいで終わりそうです。そうなったらEPWING化にもチャレンジします。教えて下さった方、ありがとうございました。
- [2010/11/23追記] 上記サイトでは、2009年9月の567ページ目の投稿が最後で、その後進んでいないようです。また、実質OCRしただけのレベルのようで、校正はされていないようです。
- [2011/08/06追記] 自前でテキスト化することにしました。Digital Gaffiot をご覧ください。相変わらずフランス語は全くわかりません。
- 【夢】ギリシャ語のWORDS
- [2011/04/03追記] 出来たら凄い。おそらく問題は、語尾変化の規則理解と、語の変化形種類・訳と語尾変化規則を大量に(数万語、数千規則?)手入力する手間。