【ラーメンズ】特殊な50音表を探索してみた【50 on 5】
2020/05/17ラーメンズは,日本のお笑いコンビです.
あまりテレビに出ないので知らない方も多いと思うのですが,有名なところだと 10本アニメの声を担当していたり,昔のMacのCM に出演していたりします.また,インターネット老人会の方には「千葉!滋賀!佐賀!」と言えば伝わります.
背景
ラーメンズの「50 on 5(ごじゅうおんごと読む.多分)」というネタを観ていました.これは,教材用50音表を制作する会社の話です.50音表とは,例えば以下のようなものです.
ある日,社員は部長に50音表のリニューアルを頼まれます.
部長「このポスターの、単語を差し替えてほしいんだ。 例えばこれ、『た』、『たんぼ』」
社員「はい」
部長「『そ』、『そろばん』」
社員「はい。いいじゃないですか」
部長「いやいや、たんぼもそろばんも、最近はピンと来ない子が多いんだそうだ。時代だよ、時代」
社員「じゃあ『た』は……」
部長「タンマツ」
社員「おおー、さすが部長」
50 on 5(ラーメンズ台本)
※以降出典略
そこで,社員はアルバイトと一緒にリニューアル作業に取り掛かることになります.
社員「というわけで、その教材用五十音ポスターの、各単語を差し替えてほしいんだ」
バイト「なるほど、別にこのままでいい気もしますけどね」
社員「いやいや、『た』の『たんぼ』とか、『そ』の『そろばん』とかさ、最近の子供にはピンと来ないんだそうだ」
バイト「じゃあ『た』は?」
社員「(得意げに)ふふん、『たんまつ』」
バイト「それはどうっすかね?」
社員「お、俺もどうかと思ったんだけどさ、部長がそうしろって」
アルバイトは,50音全てに同じ字をつけることを提案します.
バイト「ひらがなってこんなにあるのかぁ。あ、じゃあこういうのどうですか?」
社員「ん?」
バイト「五十音全部に、同じ字を付ける」
社員「同じ字?そんなんじゃ成立しないだろ」
バイト「ふふーん。『か』ですよ」
社員「か?」
バイト「『あ』からいきますよ。『あか』」
社員「うん」
バイト「『いか』」
社員「うん」
バイト「『うか』」
社員「うん!」
バイト『えか』」
社員「うん?」
バイト「『おか』」
社員「うん……『えか』って?」
バイト「そら一個や二個の不具合はありますよ」
社員「一個や二個でもあっちゃ困るんだよ」
そりゃ困ります.
バイト「ん?一個や二個、三個、四個。あ!これだ!」
社員「え?」
バイト「『んこ』だ!」
社員「んこ?」
バイト「そうです、『さんこ』『よんこ』『なんこ』。ね?『てんこ』『わんこ』『きんこ』『はんこ』。ほら!」
社員「でも五十音全部は無理だろ」
うーん…無理なんでしょうか?
バイト「いけますよ。『あんこ』『いんこ』…」
社員「うん、待った待った」
まぁ「うんこ」は成立するとして,「すんこ」や「そんこ」は意味がわからないのでダメですね.
でも,他の字ではどうなんでしょうか.もしかしたら50音すべてで意味が通るものがあるのでは?
気になったので,探索してみることにしました.
探索方法
日本語のあらゆる単語をデータベースにつっこんで解析します.
単語のリストには,MeCabという形態素解析ライブラリで使用されるIPA辞書を用います.この辞書に含まれる単語のうち,以下の条件に当てはまる133,371単語を探索に使用しました.
- 品詞が以下のどれか
- 名詞(人名を除く)
- 動詞(基本形)
- 形容詞(基本形)
- ヨミが清音で始まっている
特に難しい実装はしていません.シェル,TypeScript,MySQL,Dockerなどを使いました.コードはこちらにあります.
探索結果
くっつける文字数別に結果をみていきます.
1文字
# | suffix | count |
---|---|---|
1 | イ | 41 |
2 | キ | 39 |
3 | リ | 39 |
4 | ル | 38 |
5 | ジ | 38 |
... |
これは,「後ろにくっつけやすい文字ランキング」です.
suffixは,後ろにくっつける文字です.countは,その文字で実際に50音表を作ったときに,成立する単語の数を表しています.例えば「イ」で50音表を作ってみましょう.
41個の単語ができています!同音異義語がある場合は,適当に1つ選んでいます.
50音表には,現在使われなくなった文字を除いて46個の文字があります.「イ」だと41/46が埋まっており,「も」「り」「ろ」「を」「ん」が空欄です.
表をすべて埋めることはできませんでしたが,「イ」はかなり健闘したほうだと思います.「を」とか「ん」に関しては,もうしょうがない気がしますし.
ちなみに,ネタの中で出てきた「カ」は…
# | suffix | count |
---|---|---|
... | ||
18 | コ | 32 |
19 | カ | 32 |
20 | ノ | 32 |
... |
ありました.19/46位で32/46単語です.「イ」にくらべると少ないですね.
2文字
2文字のランキングは…
# | suffix | count |
---|---|---|
1 | ガワ | 32 |
2 | トウ | 32 |
3 | シマ | 32 |
4 | レル | 30 |
5 | ンジ | 30 |
... |
「ガワ」?なんだか想像がつかないです.表を作ってみます.
あーほぼ川の名前ですね…
これはなんかずるいので,「トウ」をみてみます.
お,だいぶ一般名詞が増えていい感じです.
ちなみに,ネタで出てきた「ンコ」は20単語で87位でした.表を作ってみます.
何とは言いませんが,エグい単語はIPA辞書に含まれていないんですね.教材を想定しているので,これは好都合です.
3文字以上
3文字のランキングは,
# | suffix | count |
---|---|---|
1 | ンコウ | 30 |
2 | ンセイ | 30 |
3 | ントウ | 29 |
4 | ジョウ | 29 |
5 | ンドウ | 28 |
... |
となりました.「ン」から始まるものが多いです.
いわれてみれば,ヨミが4音の単語は2文字目が「ン」であることが多い気がします.1位の「ンコウ」の表を見てみましょう.
なんとなくテンポがいいですね.
4文字のランキングは
# | suffix | count |
---|---|---|
1 | ンジョウ | 30 |
2 | ンショウ | 29 |
3 | ンチョウ | 28 |
4 | ンキュウ | 21 |
5 | ンシュウ | 21 |
... |
となりました.文字数を増やすにしたがって,成立する単語数がどんどん減ってきています.
唯一30個の単語を成立させた,「ンジョウ」の表をみてみます.
よくできていますね!
5文字のランキングを見てみます.
# | suffix | count |
---|---|---|
1 | ンショウジ | 14 |
2 | ンジョウジ | 10 |
3 | サカトウゲ | 9 |
4 | ンベツガワ | 7 |
5 | リアワセル | 7 |
... |
成立する単語数が一気に減っています.今回はそれぞれの単語例を見てみます.
suffix | 単語例 |
---|---|
ンショウジ | あ: 安正寺 |
ンジョウジ | あ: 安城寺 |
サカトウゲ | う: 宇坂峠 |
ンベツガワ | え: 遠別川 |
リアワセル | あ: 有り合わせる |
先ほどと違い,2字熟語がありません.かわりに,お寺の名前や地名,動詞などがあらわれています.
これ以上文字数を増やしても,countは増えそうにないので,ここで探索をやめておきます.
まとめ
46音すべてをカバーする文字は見つけられませんでしたが,「イ」はかなり良いところまで行っていましたね.
今後の改良点として,語彙の強化があげられます.今回はIPA辞書のみを用いましたが,他にも以下のような辞書が無料で利用できるはずです.
あとはWikipediaからヨミを推定して辞書を作るとか,広辞苑などのEPWING版を買ってゴニョゴニョするとか…
気が向いたらやってみようと思います.
日本語って面白いですね.