夢織に使われた語彙を調べたところ、下記のデータが得られた。
・使用した総語数:10,438語。ただし数字も含む。
・異なり語数:1,486語。数字は除く。
・異なり語数:1,486語。数字は除く。
従って、夢織のに使用した語彙はおよそ1,500語と言える。
中学英語の語彙数が1,000〜3,000であるから、英検4級程度とみなすことができる。
中学英語の語彙数が1,000〜3,000であるから、英検4級程度とみなすことができる。
だが、実際には英検3級程度のアルカ能力が必要と思われる。
というのも、英検と違い、夢織には難しい単語も使用しているためである。
使用した語彙の数だけ単語を知っていれば読めるわけではない。
従って、1,500と言っても、英語に置き換えれば英検3級から準2級程度の能力は必要とセレンは考える。
というのも、英検と違い、夢織には難しい単語も使用しているためである。
使用した語彙の数だけ単語を知っていれば読めるわけではない。
従って、1,500と言っても、英語に置き換えれば英検3級から準2級程度の能力は必要とセレンは考える。
●誤差について
なお、活用形は別の単語としてカウントしている。keとkekを別の単語とカウントしている。
また、eとtを別項目としてカウントしている。leとlも同様である。
逆に、感動詞のaと格詞のaを同じ項目としてカウントしている。
さらに、n...nonのような表現においてnを単語としてカウントしている。
また、eとtを別項目としてカウントしている。leとlも同様である。
逆に、感動詞のaと格詞のaを同じ項目としてカウントしている。
さらに、n...nonのような表現においてnを単語としてカウントしている。
従って、実際の異なり語数はもう少し少ないはずである。
恐らく1,400語ほどではないか。
恐らく1,400語ほどではないか。
●コーパスの閲覧
●おまけ
ワードで夢織の文字数をカウントしたら約40,000字だった。
総語数が10,000なので、アルカの単語の平均長は4字前後ということになる。
総語数が10,000なので、アルカの単語の平均長は4字前後ということになる。
4というのは1文字掠れて見えなくなっても再現が聞く程度の長さがあり、逆に冗長でない簡潔さを持った数字である。
体感的に、4というのは使いやすいと思う。だから、この結果には満足している。
アルカは書くのも解読するのも適切な長さを持っていると言えるからだ。
体感的に、4というのは使いやすいと思う。だから、この結果には満足している。
アルカは書くのも解読するのも適切な長さを持っていると言えるからだ。
4が言いやすいというのは、英語のfour-letter-wordsを見ても明らかである。
隠語も罵倒も、第一に言いやすくなければならない。論文で使う学名とは違う。
そういえば日本語も4モーラが好きだ。これは音素数では8になってしまうが。
隠語も罵倒も、第一に言いやすくなければならない。論文で使う学名とは違う。
そういえば日本語も4モーラが好きだ。これは音素数では8になってしまうが。
言語を実用する上で4が使いやすいなら、この結果は満足である。
3は短い。5は長い。論文を書いたら、逆に5になってしまうだろう。
論文はその性質上、単語が長くて然るべきだ。
3は短い。5は長い。論文を書いたら、逆に5になってしまうだろう。
論文はその性質上、単語が長くて然るべきだ。