形態素解析を使ってプロポーズの言葉を考えてみた。
移転しました。
約3秒後に自動的にリダイレクトします。
結婚するなら避けては通れない通過儀礼。言って当たり前、言わなかったら一生後悔プロポーズです。これまでの自らの行いに関して最後の審判が下される訳ですが、結婚されている元被告人の方々は最後の言葉をどのように考えましたか?正直言って全然思い付きませんよね。
僕の考えでは「毎朝味噌汁を作ってほしいんだ」が言ってみたいプロポーズの言葉ランキング第一位なのですが、上の画像のようにひざまずいてプロポーズしてみたい僕としては、セリフと格好のバランスを取れていないような気がしています。しかもこの言葉を実際に言ってしまったら微妙な反応をされるのは目に見えていますし、下手したら逆に味噌汁を作ってくれない可能性すら懸念されますね。
そこで今回は天変地異が起ころうとも常に王道スタイルを好む僕が形態素解析を行って実験的にプロポーズの言葉を考えてみたいと思います。
もしも、プロポーズの言葉でお悩みの方がいらっしゃれば参考にして頂けたら幸いです。
形態素解析とはなんだ?
形態素解析とは、
「対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い、自然言語で書かれた文を形 態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの品詞を判別する作業」(Wikipedia)
はい。よく分かりませんね。
例えば、「すもももももももものうち」を形態素解析すると「すもも/も/もも/も/もも/の/うち」というように品詞分解できます。
※今回の形態素解析には、RパッケージのRMeCabを使用しました。「Rによるテキストマイニング入門(石田基広)」を参考にしながら、Rで形態素解析を行いました。
プロポーズの言葉のサンプル
今回はネット上に落ちているプロポーズの言葉のサンプルを258個拾ってきました。基本的に男性側のプロポーズの言葉を集めています。なぜ258個だけかというと、思ったより見つからなかったためです。サンプル数が少ないのはご容赦ください。
さて、この1つずつの「プロポーズの言葉」に対して、1つの文を形態素まで分解し、どの単語がどの程度の回数、頻出しているかをみてみます。
形態素解析の結果
そうして作成したデータをエクセルで整理したのが下記のキーワードの頻出表です。
品詞は動詞、名詞、助動詞、形容詞に絞って単語リストを作成しました。また、度数は、その単語が何回頻出したかを表します。つまり、最も頻出した単語「する」は258個のセリフのうち51.9%の確率で出現するということです。しかし、「する」がセリフにそのまま出てくることはほとんどなく、「する」という動詞の活用(未然形)の「しよう」という形で現れています。
同様に「いる」「なる」という動詞も「○○でいよう」「○○になろう」という形で現れています。この3つの動詞の頻度数を合計すると214個となり、82%の確率で「しよう」「いよう」といった提案の形が取られているが分かります。
以上より王道スタイルは「結婚しよう」で決定ですね。
まあ、プロポーズの言葉は、相手への提案であることを考えれば当然の結果でしょうか。この時点で僕が言いたかった「毎朝味噌汁を作ってほしいんだ」という自分の要望だけを伝えるプロポーズが異端だったことが判明しました。やっぱり奇をてらった小細工をするよりベタな方が絶対喜ばれるという王道論を展開中です。
次に、品詞を名詞に限定してみれば、以下のようになります。
「結婚」という単語が第一位になります。やはり、プロポーズは「結婚しよう」という基本形が多いようです。その際、使用される一人称には「俺」「僕」、二人称には「君」「あなた」「お前」の順に使用されることが分かりました。
王道スタイルは一人称に「俺」二人称に「君」と呼ぶのが良いでしょう。
僕としてはどうしても彼女に対して「お前」という呼び方は失礼な気がしてしまうのですが、男気あふれる男性はまだまだ日本にもいるみたいです。と言っても10人中1人なので少ないかもしれません。
しかし、ですよ。意外だったのは「結婚」という単語の出現率は約3割に留まることです。頻度表ではよく分かりませんでしたが、みなさんド直球な言葉より、自分なりの言い回しを使ってプロポーズをされているのかもしれません。
また、第9位、第10位で現れた「一生」「人生」という長い年月を共に過ごしたいという強い決意を表す単語が15.2%の確率で使われているようです。
現実には日本の婚姻関係を結んだカップルの3組に1組は離婚してしまう訳ですが、プロポーズの際には強い決意を持っているのだと推察されます。
「一生」「人生」といった、長年を共にする決意表明のような単語をプロポーズに使用した方々のその後の結婚生活を追跡調査をしてみると面白いんじゃないかと思います。しかし、僕の様な所詮ザコには調査費用も時間もありませんのでアカデミックな方々に後述をお譲りしたいと思います。というか、誰かやって頂けないでしょうか。
単語のネットワーク分析
はてさて、当たり前のことばかりつらつらと書いてしまいました。もう少し面白い話はないんかいという感じなのでネットワーク図を作成してみます。
単語の出現パターンをベクトルで表したものがネットワーク図です。ベクトルで結ばれた単語がテキストの中に同時用いられていることを指します。これにより、各単語がどのように使用されているのかが視覚的に分かるようになります。
全体を表すと「結婚」「幸せ」という頻度数が高い単語の周りにその他の単語が散らばっているようです。中心にある単語から構成される基本型「私と結婚しよう」にその脇にある単語を加えることでアレンジができそうです。
図にしてみて気が付いたのですが「ハゲ」という単語が使われていました。
なんだこれ?と思ってサンプルを調べてみると「お腹が出てもハゲになっても、一緒に歩いてくれますか?」といったプロポーズの言葉がありました。
毛髪に悩みを抱えている方は「将来ハゲても嫌いにならないでくれよ?」と先に述べておき、お嫁さんに了解をとっておきたくなるのでしょうか。僕としてはそんなに重要だとは思いませんが、チェケラッチョ、ハゲラッチョではお嫁さんが結婚生活を気分良く生活できないものなのでしょうか。事情通の方ご意見お待ちしております。
プロポーズの言葉を考えてみる
さて、せっかくなのでこのネットワーク図を利用して、僕のプロポーズの言葉を考えてみたいと思います。方法は適当に単語を選んでベクトルを辿るだけです。
すると、、
結果は
「君と一緒に幸せな一生を過ごしてみたいんだ。僕と結婚しよう。」
うんうんうん。「みたいんだ」という言い回しが気に食わなさ過ぎるだろ。お試し感満載じゃないか。「ちょっと試食してみたい」くらいの決意しか無さそうですよね。いや「家政婦はミタ」の三田さんに言うのなら分かりますよ。「君と一緒に幸せな一生を過ごして三田い」つまり三田家に養子に行きたいと言うことでしょう。 でも、そもそも僕は三田さんに出会ったことありませんからね?いや三田さんいたわ。中学校の頃に三田っちって呼んでた先生。
まとめ
簡単なテキストマイニングを行うだけでも、いくつかの発見が得ることが出来ました。サンプル数が少ない点が反省点ですね。
また、今回行った結果はサンプルを単純に分解しただけなので、もっとシステマティックに知見を得ることができる方法について勉強したいと思います。
以上長々とありがとうございました。
おまけ(個人的に面白いと思ったプロポーズの言葉)
「オレはもうこの目覚まし時計と別れるよ。」
「安月給で苦労かけるけど、一緒に苦労をしてください!!」
「ゼクシィ買いに行こっか。」
「ねぇ。僕と同じ苗字になって!」
「僕の飼い主になってください」←猫ヒロシ氏の言葉
「来世も再来世もずっと一緒にいよう」←海老蔵氏の言葉
「俺の人生半分やるから、おまえの人生半分くれ!」
「人生のフェアウェイを一緒に歩いて行こうね」
「どうする?頼む!!駄目ですか?まだですか?」
プロポーズのシチュエーションに困ったらこのドラマを観ましょう
ジャニオタの方々にとって「明日やろうは馬鹿野郎なんだよ(うろ覚え)」という山Pのセリフは絶頂シーンでしょうね。でも悲しいことに、山Pが言ったであろうプロポーズのセリフが思い出せないんですよね。普通に面白いので機会があれば是非ご覧ください。
ちなみにドラマの原作となった小説はこちらです。
- 作者: 脚本金子茂樹/ノベライズ白崎博史
- 出版社/メーカー: マガジンハウス
- 発売日: 2007/06/08
- メディア: 単行本(ソフトカバー)
- 購入: 1人 クリック: 21回
- この商品を含むブログ (2件) を見る