« 英辞郎を使う(Windows10,Android) | トップページ | BoyueT62Dファームウェア更新で起動しなくなった際の復旧手順 »

2017年2月11日 (土)

英英和辞典(WordNet EPWING)

英英和辞典(WordNet EPWING)

 Androidで利用できる英英和辞典といったら,
   (a) Collins COBUILD English/Chinese/Japanese/Korean
   (b) 英英和辞書Word-G
ぐらいしか認識していなかった。(a)は語彙数が少なく,(b)は発音記号が無いのが欠点だった。

 (以前の記事)
   http://midorigame-ferret.cocolog-nifty.com/blog/2015/01/2kindleandroid-.html
   20150124 : 続2)英英和辞典・英英辞典(Kindle・Android版比較)

 今回,英辞郎の関係でEBPocketを使ったが,このつながりで,EPWING版のWordNetの英英和辞典を発見した。
   (c) 「Princeton WordNet 3.0 と日本語WordNet 1.1の統合版」(以下,「WordNet統合版」と略)
   http://wordnetepwing.osdn.jp/
   WordNet EPWING ~~ 日本語・英語WordNet(シソーラス)のEPWING版 ~~
で,
  「Princeton WordNet 3.0 と日本語WordNet 1.1の統合版 - wordnet-enjp-130629.zip」(147MB)
がそれである。Word-G同様,発音記号が無いが,そこは串刺し検索や複数辞書を使える利点で補えばよい。発音記号は英辞郎(PDIC,あるいはStarDict変換したもの)や「CMU American English spelling」(米国式発音記号)で見ればよい訳だ。

 WordNet統合版の辞書のサイズは,ZIP展開後で 580MB ある。もっとも,EBPocketでは,辞書データをSDHCに持つことができるので,本体メモリを圧迫することがない。一方,英英和辞書Word-Gは,設定-アプリ情報で見ると,アプリ 40.32MB,データ 103MB(合計143MB)とコンパクト。いや,以前は大きいと感じたし,「SDカードへ移動」できない欠点はあるのだが,なかなか頑張っているのだなと再認識した。

 EPWING形式は,AndroidのEB Pocketだけでなく,PC(Windows)のEBWin4やLogophileでも,もちろん使える。Word-GはAndroidしか使えないので,この点でもWordNet統合版は優れている。

2017-02-10 懶道人(monogusadoujin)

【試行(検索)結果】

 ちなみに,「terrapin」で検索すると,このWordNet統合版は下記のような結果が表示される。

|1 n. [01667778] any of various edible North American web-footed turtles living in fresh or brackish water
|北米の淡水または半塩水に生息する水かきのある食用の亀。
|1.1 [01662784] n. hype turtle
|カメ
|1.2 [01668091] n. hypo diamondback terrapin, Malaclemys centrata
|ダイヤモンドガメ
|1.3 [01667570] n. mem.holo Emydidae, family Emydidae
|ヌマガメ科

一方,「Word-G」だと下記で,ほぼ同等。概念構成はWord-Gがわかりやすいが,「ヌマガメ科」「ダイヤモンドガメ」の説明のあるWordNet統合版もよい。しかし「スッポン」ってのは違うんじゃないかな。

|[noun]
|スッポン

|北米の淡水または半塩水に生息する水かきのある食用の亀

|any of various edible North American web-footed turtles living in fresh or brackish water

|[Holonym - Member|構成要素 - 構成員]
|Emydidae, family Emydidae

|[Hypernym ↑|上位語]
|turtle

|[Hyponym↓|下位語]
|diamondback terrapin, Malaclemys centrata

ちなみに,(a)の「Collins COBUILD English/Chinese/Japanese/Korean」には「terrapin」は載っていない。同じDIOTEKの「Collins COBUILD ENGLISH LEARNER’S DioDict」(Collins English Dictionary)
   https://play.google.com/store/apps/details?id=com.diotek.diodict3.phone.btoc.adddict.collins.cad
なら,「A terrapin is a reptile which has a thick shell covering its body and which lives partly in water and partly on land.」と出るのだが。

これが「ferret」だと,WordNet統合版とWord-Gは語義の順序が異なっている。
   http://wordnetepwing.osdn.jp/
   WordNet EPWING ~~ 日本語・英語WordNet(シソーラス)のEPWING版 ~~
の,
  「Brown Corpus付きPronceton WordNet 3.1 - wordnet-en-140419.zip」(51MB)(英英辞典)
と比較すると,この3.1とWord-Gが語義の順序が一致する。

 さて,WordNetの利用についてだが,下記の点には留意する必要があろう。内容の正しさという点。

http://www.maruo.co.jp/honyaku/7/x04002_pjdzv.html
EPWING形式のWordNet3.1
日英統合版について
2013-10-22

|ご指摘の問題について調べましたら、WordNet3.0 の元データの誤りが根本原因で、
|3.1では修正されていました(詳細後述)。
|日本語版はWordNet3.0にしか対応しておらず、英語3.1&日本語版は(機械的には)
|作成できません。

|もう一つ、日本語WordNet 本家( http://nlpwww.nict.go.jp/wn-ja/ ) の方に、
|  注:: このリリース版では、全エントリーのうちの5%ほどがエラーと
|  考えられます。これは細かくチェックするより、まずはなるべく広くカバー
|  することに力を注いだためです。
|と書かれています。この点もご了承下さい。私にはどうしようもありません。
|ここで言う5%のエラーが具体的にどういうものか(リンク番号エラーか語釈の
|エラーかなど)も分かっていません。

(中略)

|問題の原因についてです。
|WordNet 3.0 の元データで heterogeneous を探すと
| heterogeneous a 2 4 ! & ^ + 2 1 01198737 00181373
|とありました。これは、01198737 と 00181373 の2つの synset に対応していることを
|示します。しかし、00181373 に対応する語を元データから探すと
| heterogeneous%3:00:02:: 00181373 2 0
| heterogenous%3:00:00:: 00181373 2 0
| reelection%1:04:00:: 00181373 1 1
|の3件が見つかりました。3番目の reelection が明らかにおかしいのですが、
|私が作成した英語&日本語統合プログラムは機械的に統合しているだけなので、
|heterogeneous の語釈として再選挙の意味が紛れ込みました。
|変換プログラムで想定していないパターンでした。
|WordNet3.1のデータでは、reelection の関連は消えていました。
|なお 01198737 については問題ありませんでした。

|そういう誤りがある事を前提に、語と意味の関連検索プログラムを改良すれば
|この問題を解決できるかも知れませんが、よく分かりません。
|全部の項目がheterogeneousのようにずれているとは思っていませんが、
|同様の問題が大量にあると厄介です。
|また、修正できたとしても上記の「5%エラー」は別問題なので解決しないと思います。

|いずれにせよ、100%完璧で有用な辞書データが無料で手に入って当たり前、
|と思われている方には全くお薦めできないものなのは確かです。
|また、おそらくプロの方の実用には耐えないかと思います。
|悪しからずご了承ください。」

 それと,WordNetは単なる辞典ではない。上記2013/10/30 には

http://www.visuwords.com/
|は、最初に見ていればWordNetが何なのかが直感的に分かったかと思いました。
|感じを掴むには良いのですが、慣れたら毎回「ビヨォ~~ン」にはつきあえない
|ですね。
|言葉の意味をそれに関連する言葉でイメージする、というのはなんとも不思議な
|感覚ですが、それこそWordNetの特徴だと思います。

と書かれており,なるほど,Wikipedia等の説明を図示するとこうなるのか,と納得。
   https://ja.wikipedia.org/wiki/WordNet
   WordNet(わーどねっと)は英語の概念辞書(意味辞書)である。約15万語。

   http://nlpwww.nict.go.jp/wn-ja/jpn/detail.html
   日本語ワードネットとは?(詳細)
   http://compling.hss.ntu.edu.sg/wnja/jpn/index.html
   日本語ワードネットとは?(概要)

 上記(概要)によれば,「英和和英辞典 (ウェブリオ株式会社, Weblio辞書 内)」での利用もできるとあり,オフライン辞書や上位語・下位語等の結びつき(WordNet)にこだわらなければ,語義だけはオンラインで表示できるようである。
   http://ejje.weblio.jp/
   英和和英辞典 (ウェブリオ株式会社, Weblio辞書 内)

さきの「terrapin」については,下記のように表示された。weblioは確かAndroidアプリもあったはず(未試行)。それにしても,語義がこれほど分かれているのは珍しい。複数辞書にあたってみるのは,やはり大切だと再認識した。なぜ「terrapin」にこだわるのか・・・は,また別に記すつもり。実のところ,weblioで表示された下記の辞典でも不十分だ。アメリカ英語とイギリス英語の違いもあるからだ。

(weblioによる「terrapin」の結果)
研究社 新英和中辞典:「【動物, 動物学】 ヌマガメ科のカメ; (特に)キスイガメ,ダイヤモンドテラピン 《北米産食用カメ》.」

Eゲイト英和辞典:「名詞 ≪動≫アメリカハコガメ(北米産;食用にもなる)」

JST科学技術用語日英対訳辞書:「スッポン」

日本語WordNet(英和):名詞 1 北米の淡水または半塩水に生息する水かきのある食用の亀(any of various edible North American web-footed turtles living in fresh or brackish water)」

クロスランゲージ 37分野専門語辞書:「スッポン; テラピン」

Wiktionary英語版:「語源:From an Algonquian word torope ("little turtle"); compare Abenaki tolba (“turtle”).」「名詞 terrapin (複数形 terrapins):Any of several North American turtles, of the family Emydidae, that live in fresh or brackish water.」

以上

【関連記事一覧】
http://midorigame-ferret.cocolog-nifty.com/blog/2011/08/collinsc-romlog.html
20110816 : 「Collinsコウビルド米語版英英和辞典」ソフト欠点解消(Logophile他)

http://midorigame-ferret.cocolog-nifty.com/blog/2011/08/collinscd-rom-7.html
20110819 : 「Collinsコウビルド米語版英英和辞典」ソフト欠点解消2(設定を変えるだけ)

http://midorigame-ferret.cocolog-nifty.com/blog/2011/08/canons502idf-22.html
20110820 : Canon電子辞典S502とIDF-2200Eとの比較

http://midorigame-ferret.cocolog-nifty.com/blog/2015/01/collinskindle-0.html
20150113 : 続)Collinsコウビルド米語版英英和辞典(今度はKindle版)

http://midorigame-ferret.cocolog-nifty.com/blog/2015/01/kindleandroid-7.html
20150123 : 続)英英和辞典・英英辞典(Kindle・Android版比較)

http://midorigame-ferret.cocolog-nifty.com/blog/2015/01/2kindleandroid-.html
20150124 : 続2)英英和辞典・英英辞典(Kindle・Android版比較)

http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/windows10androi.html
20170209 : 英辞郎を使う(Windows10,Android)

http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/wordnet-epwing-.html
20170211 : 英英和辞典(WordNet EPWING)

http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/my-word-coachds.html
20170223 : 英単語「見出し語当てゲーム」なら,「My Word Coach」(DS),「Test Your English」シリーズ(Android),「3000 Oxford Words」(Android)など

http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/futureumy-sat-c.html
20170227 : 英単語「見出し語当てゲーム」その2:「futureU」と「My SAT Coach with The Princeton Review」(Nintendo DS)

  http://midorigame-ferret.cocolog-nifty.com/blog/2015/07/kindle-319f.html
  20150709 : ヴァン・ヴォークト「宇宙船ビーグル号の冒険」の原著をKindleで読む
  
  http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/dsamazoncom-cdd.html
  20170226 : 任天堂DSソフト(海外版)を購入:amazon.comから購入(個人輸入代行業者を使う)/海外ショップの利用

http://midorigame-ferret.cocolog-nifty.com/blog/2017/02/5nintendo-ds-89.html
20170228 : 「見出し語当てゲーム」その3:「意味までわかる 大人の熟語練習 角川類語新辞典から5万問」,「読みトレ」(Nintendo DS)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/01/all-english-jap.html
20180113 : オンライン辞書の横断検索アプリ(「All英語辞書, English ⇔ Japanese」:COBUILD英英,Cambridge英英和,Weblio,英辞郎,ほか英和・英英)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/01/cambridgeclip2d.html
20180127 : Cambridge英英和辞典をClip2Dicで

http://midorigame-ferret.cocolog-nifty.com/blog/2018/01/cambridgemoonre.html
20180128 : Cambridge英英和辞典をMoon+Reader(天下一読)で

http://midorigame-ferret.cocolog-nifty.com/blog/2018/03/cambridgewindow.html
20180321 : Cambridge英英和辞典を,Windows10アプリやChromeの文字列範囲指定→マウス右クリックで使う

http://midorigame-ferret.cocolog-nifty.com/blog/2018/03/cambridge201803.html
20180325 : Cambridge英英和辞典を「サポテキ」(SupportText)で

http://midorigame-ferret.cocolog-nifty.com/blog/2018/03/cambridgewind-1.html
20180328 : Cambridge英英和辞典をWindows10で(その2)Chrome拡張機能「Search Center」

http://midorigame-ferret.cocolog-nifty.com/blog/2018/04/cambridgewindow.html
20180415 : Cambridge英英和辞典をWindows10で(その3)「QuickAction」と「EBWin4」

|

« 英辞郎を使う(Windows10,Android) | トップページ | BoyueT62Dファームウェア更新で起動しなくなった際の復旧手順 »

パソコン・インターネット」カテゴリの記事

携帯・デジカメ」カテゴリの記事

」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: 英英和辞典(WordNet EPWING):

« 英辞郎を使う(Windows10,Android) | トップページ | BoyueT62Dファームウェア更新で起動しなくなった際の復旧手順 »