実験スピリッツ

経済・市場・思想の陰謀論をまとめます(ネタ要素強め)

スポンサーリンク

テキストマイニングでご当地ラーメンを特徴ごとに分類してご紹介

移転しました。

約3秒後に自動的にリダイレクトします。

f:id:yw555201:20151005035410j:plain

突然ですが、僕の好きな食べ物は麺類です。「無人島に持っていくとしたら?」の質問には食い気味で「麺類」と答えるでしょう。「無人…」の時点で「麺類!」と答えることができます。

「麺類」といってもスパゲティ、うどん、そば、ラーメン、つけ麺、そーめんなど様々な種類があります。文字にするだけでもお腹が減ってきますね。

その中でもご当地ラーメンと呼ばれるように、ラーメンは地域によって多様な進化を遂げてきています。

しかし、ご当地ラーメンと一言で言っても、例えば和歌山ラーメンにも豚骨系と醤油系があったりして、真の和歌山ラーメンがなんなのかはっきりしていないような気がします。和歌山まで旅行に行ったのに、普通のチェーン店で普通のラーメンを食べてしまったらもったいないですよね。

そこで、ラーメンマンの僕としてはご当地ラーメンがどんな特徴を持っていて、主流がどんなラーメンなのか把握したいのです。

今回のエントリーでは、代表的なラーメンがどのようなニーズの人におすすめか分かる内容になっておりますので是非ラーメン巡りをする際の参考にしてください

分析するご当地ラーメン

分析するのは代表的な種類である・ 札幌ラーメン・旭川ラーメン・函館ラーメン・喜多方ラーメン・東京ラーメン・横浜ラーメン・京都ラーメン・和歌山ラーメン・尾道ラーメン・広島ラーメン・徳島ラーメン・博多ラーメン・熊本ラーメン・鹿児島ラーメンの14種類です。これらは最低限ラーメンを語る上で知らなきゃ恥ずかしいですね。僕は全然知りませんが。

しかし、まあなんかラーメンラーメン書きすぎてメンヘラと書いてあるんじゃないかと思ってしまいますね。何をいっているんでしょうか僕は。

画像は日本全国のご当地ラーメンエリアです。

f:id:yw555201:20151003005248g:plain

引用~新横浜ラーメン博物館~

テキストマイニングの結果

さてそれでは実際にデータ分析の方法をお話します。

今回は、R言語とツイッターを使用して、各ご当地ラーメンに関するツイートを1000個づつ自動収集しました。そこで得られたツイッターテキストをRMeCabを使用してデータマイニングします。

その結果、魚介、塩、豚骨、醤油、味噌、野菜、鶏がら、魚介類、脂、野菜などのキーワードの頻度を比較の指標にしてクロス集計表を作成しました。それが以下の表になります。

f:id:yw555201:20151005023854p:plain

クロス集計表だけでも各種類のラーメンの特徴が分かりますが、特徴がぱっと見で分かりにくいですね。

もう少し視覚的に分かりやすい形にしてみます。

コレスポンデンス分析

コレスポンデンス分析で構造の視覚化を行っていきます。

コレスポンデンス分析とは対応分析とも呼ばれます。基本的な考え方は列項目と行項目の相関が最高になるように両方とも並べ替える事です。

分析の結果、自分でクラスタリングを行ったのが下記の散布図です。クラスタリングは似た者同士をまとめてグループに分類するということです。

私はこのコレスポンデンス分析の結果を以下の図のように4つのグループに分けて解釈しました。

f:id:yw555201:20151005025011p:plain

繰り返しになりますが、コレスポンデンス分析は行と列が相関が最大になるように双方を並び変えた物です。
例えば九州のラーメン、熊本と博多、鹿児島はとても近い位置にありますが、これは豚骨との相関が他のラーメンと比べてとても高いことを示しています。逆に豚骨から最も遠い札幌ラーメンは豚骨との相関がとても低いということです。
より簡単に説明すると各ラーメンの名前は近いほど似ていて、醤油などのジャンルなどのキーワードと近いラーメンほどその要素が強いということです。

醤油に関しては、地域ごとに細かく分類されるので、細かく鶏がら、魚介類、野菜、脂でジャンル分けしました。

これで各種類のラーメンの主流がはっきりしました。

各種ご当地ラーメンの主流

それでは、テキストマイニングではっきりした特徴的なご当地ラーメンをいくつかご紹介していきます。

・札幌ラーメン

札幌は味噌ラーメンの発祥地です。もはや味噌ラーメンは全て札幌ラーメンと言っていいくらい代表格です。また、データを取得した結果、カレースープという単語がツイートに多く含まれていました。最近流行りのカレースープラーメンも札幌が発祥地のようです。

f:id:yw555201:20151005035410j:plain

・函館ラーメン

函館ラーメンと言えば塩ラーメンです。しかも、具は魚介類が多く含まれているものです。海の幸が豊富な函館らしく、ダシは昆布で、イカや貝柱などの具が盛り付けられているものを函館ラーメンの代表と言ってよいでしょう。

f:id:yw555201:20151005035359j:plain

・喜多方ラーメン

喜多方ラーメンはズバリ「さっぱり醤油で野菜たっぷりのラーメン」です。特に野菜に関するテキストが多く見られました。

f:id:yw555201:20151005035348j:plain

・横浜ラーメン

横浜ラーメンは別名「家系ラーメン」と呼ばれます。テキストに「家系」という単語が約50%の確率で含まれていました。しかし、今回の分析では醤油ラーメンに分類してしまいましたが、「家系ラーメン」は鶏がらでダシを取った醤油豚骨です。分析結果に若干の偏りが見られてしまいました。

f:id:yw555201:20151005035328j:plain

・和歌山ラーメン

和歌山では「中華そば」と呼ぶのが一般的で、和歌山ラーメンの中でも色々な進化を遂げていて、分類が難しいように思います。今回の分析では、豚骨と醤油の中間、豚骨醤油味で、鶏がらや魚介でダシを取っているものだと判定されました。「すだち」という単語が多く存在し、独特の文化を築いていました。

f:id:yw555201:20151005035238j:plain

・尾道ラーメン

尾道ラーメンは「豚の背脂がたっぷりのった醤油味」です。醤油以外の尾道ラーメンなんて認められません。

f:id:yw555201:20151005035232j:plain

・熊本ラーメン・鹿児島ラーメン・博多ラーメン

九州のラーメンは何と言っても豚骨です。九州に行って豚骨以外食べるのはもったいない気がします。中でも「黒豚のチャーシュー」は注目度が高い単語でした。また、こってりとしていて、甘味のあるとろりとしたスープは九州ならではの味です。

f:id:yw555201:20151005035131j:plain

黒いのも特徴のひとつです。

f:id:yw555201:20151005035143j:plain

まじでお腹がすいてきます。

まとめ

いかがでしょうか?それぞれのご当地ラーメンの特徴がわかっていただけたでしょうか?自分が食べたいと思うラーメンが見つかったなら光栄です。

今回はデータ分析のテキストマイニングでご当地ラーメンのジャンルを分類分けしてみました。ご当地ラーメンには今回紹介しきれなかった特徴がたくさんありますが、最低限の分類はできました。研究対象を「味わいの違いが微妙なウイスキーや紅茶など」に変更して実践してみたいと思いました。

もうラーメンはただの食べ物じゃないですよね。ソウルです。

ありがとうございました。

以下参考文献です。

Rによるテキストマイニング入門

Rによるテキストマイニング入門

 
Rで学ぶ日本語テキストマイニング

Rで学ぶ日本語テキストマイニング