【ラーメンズ】特殊な50音表を探索してみた【50 on 5】

2020/05/17

ラーメンズは,日本のお笑いコンビです.

あまりテレビに出ないので知らない方も多いと思うのですが,有名なところだと 10本アニメの声を担当していたり,昔のMacのCM に出演していたりします.また,インターネット老人会の方には「千葉!滋賀!佐賀!」と言えば伝わります.

背景

ラーメンズの「50 on 5(ごじゅうおんごと読む.多分)」というネタを観ていました.これは,教材用50音表を制作する会社の話です.50音表とは,例えば以下のようなものです.

サンプル50音表

かわいい ひらがな表  無料ダウンロード・印刷

ある日,社員は部長に50音表のリニューアルを頼まれます.

部長「このポスターの、単語を差し替えてほしいんだ。 例えばこれ、『た』、『たんぼ』」

社員「はい」

部長「『そ』、『そろばん』」

社員「はい。いいじゃないですか」

部長「いやいや、たんぼもそろばんも、最近はピンと来ない子が多いんだそうだ。時代だよ、時代」

社員「じゃあ『た』は……」

部長「タンマツ」

社員「おおー、さすが部長」

50 on 5(ラーメンズ台本)
※以降出典略

そこで,社員はアルバイトと一緒にリニューアル作業に取り掛かることになります.

社員「というわけで、その教材用五十音ポスターの、各単語を差し替えてほしいんだ」

バイト「なるほど、別にこのままでいい気もしますけどね」

社員「いやいや、『た』の『たんぼ』とか、『そ』の『そろばん』とかさ、最近の子供にはピンと来ないんだそうだ」

バイト「じゃあ『た』は?」

社員「(得意げに)ふふん、『たんまつ』」

バイト「それはどうっすかね?」

社員「お、俺もどうかと思ったんだけどさ、部長がそうしろって」

アルバイトは,50音全てに同じ字をつけることを提案します.

バイト「ひらがなってこんなにあるのかぁ。あ、じゃあこういうのどうですか?」

社員「ん?」

バイト「五十音全部に、同じ字を付ける」

社員「同じ字?そんなんじゃ成立しないだろ」

バイト「ふふーん。『か』ですよ」

社員「か?」

バイト「『あ』からいきますよ。『あか』」

社員「うん」

バイト「『いか』」

社員「うん」

バイト「『うか』」

社員「うん!」

バイト『えか』」

社員「うん?」

バイト「『おか』」

社員「うん……『えか』って?」

バイト「そら一個や二個の不具合はありますよ」

社員「一個や二個でもあっちゃ困るんだよ」

そりゃ困ります.

バイト「ん?一個や二個、三個、四個。あ!これだ!」

社員「え?」

バイト「『んこ』だ!」

社員「んこ?」

バイト「そうです、『さんこ』『よんこ』『なんこ』。ね?『てんこ』『わんこ』『きんこ』『はんこ』。ほら!」

社員「でも五十音全部は無理だろ」

うーん…無理なんでしょうか?

バイト「いけますよ。『あんこ』『いんこ』…」

社員「うん、待った待った」

まぁ「うんこ」は成立するとして,「すんこ」や「そんこ」は意味がわからないのでダメですね.

でも,他の字ではどうなんでしょうか.もしかしたら50音すべてで意味が通るものがあるのでは?

気になったので,探索してみることにしました.

探索方法

日本語のあらゆる単語をデータベースにつっこんで解析します.

単語のリストには,MeCabという形態素解析ライブラリで使用されるIPA辞書を用います.この辞書に含まれる単語のうち,以下の条件に当てはまる133,371単語を探索に使用しました.

  • 品詞が以下のどれか
    • 名詞(人名を除く)
    • 動詞(基本形)
    • 形容詞(基本形)
  • ヨミが清音で始まっている

特に難しい実装はしていません.シェル,TypeScript,MySQL,Dockerなどを使いました.コードはこちらにあります.

探索結果

くっつける文字数別に結果をみていきます.

1文字

# suffix count
1 41
2 39
3 39
4 38
5 38
...

これは,「後ろにくっつけやすい文字ランキング」です.

suffixは,後ろにくっつける文字です.countは,その文字で実際に50音表を作ったときに,成立する単語の数を表しています.例えば「イ」で50音表を作ってみましょう.

50音表(イ)

41個の単語ができています!同音異義語がある場合は,適当に1つ選んでいます.

50音表には,現在使われなくなった文字を除いて46個の文字があります.「イ」だと41/46が埋まっており,「も」「り」「ろ」「を」「ん」が空欄です.

表をすべて埋めることはできませんでしたが,「イ」はかなり健闘したほうだと思います.「を」とか「ん」に関しては,もうしょうがない気がしますし.

ちなみに,ネタの中で出てきた「カ」は…

# suffix count
...
18 32
19 32
20 32
...

ありました.19/46位で32/46単語です.「イ」にくらべると少ないですね.

2文字

2文字のランキングは…

# suffix count
1 ガワ 32
2 トウ 32
3 シマ 32
4 レル 30
5 ンジ 30
...

「ガワ」?なんだか想像がつかないです.表を作ってみます.

50音表(ガワ)

あーほぼ川の名前ですね…

これはなんかずるいので,「トウ」をみてみます.

50音表(トウ)

お,だいぶ一般名詞が増えていい感じです.

ちなみに,ネタで出てきた「ンコ」は20単語で87位でした.表を作ってみます.

50音表(ンコ)

何とは言いませんが,エグい単語はIPA辞書に含まれていないんですね.教材を想定しているので,これは好都合です.

3文字以上

3文字のランキングは,

# suffix count
1 ンコウ 30
2 ンセイ 30
3 ントウ 29
4 ジョウ 29
5 ンドウ 28
...

となりました.「ン」から始まるものが多いです.

いわれてみれば,ヨミが4音の単語は2文字目が「ン」であることが多い気がします.1位の「ンコウ」の表を見てみましょう.

50音表(ンコウ)

なんとなくテンポがいいですね.

4文字のランキングは

# suffix count
1 ンジョウ 30
2 ンショウ 29
3 ンチョウ 28
4 ンキュウ 21
5 ンシュウ 21
...

となりました.文字数を増やすにしたがって,成立する単語数がどんどん減ってきています.

唯一30個の単語を成立させた,「ンジョウ」の表をみてみます.

50音表(ンジョウ)

よくできていますね!

5文字のランキングを見てみます.

# suffix count
1 ンショウジ 14
2 ンジョウジ 10
3 サカトウゲ 9
4 ンベツガワ 7
5 リアワセル 7
...

成立する単語数が一気に減っています.今回はそれぞれの単語例を見てみます.

suffix 単語例
ンショウジ あ: 安正寺
ンジョウジ あ: 安城寺
サカトウゲ う: 宇坂峠
ンベツガワ え: 遠別川
リアワセル あ: 有り合わせる

先ほどと違い,2字熟語がありません.かわりに,お寺の名前や地名,動詞などがあらわれています.

これ以上文字数を増やしても,countは増えそうにないので,ここで探索をやめておきます.

まとめ

46音すべてをカバーする文字は見つけられませんでしたが,「イ」はかなり良いところまで行っていましたね.

今後の改良点として,語彙の強化があげられます.今回はIPA辞書のみを用いましたが,他にも以下のような辞書が無料で利用できるはずです.

あとはWikipediaからヨミを推定して辞書を作るとか,広辞苑などのEPWING版を買ってゴニョゴニョするとか…

気が向いたらやってみようと思います.

日本語って面白いですね.

続けて読む…

不安だらけのリクルートインターン体験記【Recruit Internship for Specialist 2019】

2019/10/02

Rust歴7日ですが音ゲーを作りました

2021/12/09

ECMA-262を読んだ日

2022/06/10

【配布あり・編集可能】Blenderでパチンコ文字

2022/01/01

Gatsby製ブログで自然言語処理して関連記事を表示する

2020/06/12

BlenderとEeveeで地球

2021/08/11

書いた人

sititou70のアイコン画像
sititou70

都内の社会人エンジニア3年生。Web技術、3DCG、映像制作が好き。