今回は、Pythonを使用してアンケートの結果を可視化する方法について、初心者向けに解説します。特に、自然言語処理を活用して、アンケートの自由回答をワードクラウドで表示する手順を丁寧に説明します。
はじめに
ワードクラウドとは、テキストデータの中で頻繁に登場する単語を視覚的に表示する方法です。この方法を用いることで、アンケートの自由回答からどのようなキーワードが多く出ているか一目で理解することができます。
Python環境の準備
まず、Pythonがインストールされていることを確認してください。Anacondaをインストールすると、Pythonと必要なライブラリが一括でインストールされるため便利です。
必要なライブラリのインストール
ワードクラウドを生成するためには、いくつかのPythonライブラリが必要です。以下のコマンドを実行して、必要なライブラリをインストールしましょう。
!pip install numpy
!pip install matplotlib
!pip install wordcloud
アンケートデータの準備
アンケートの自由回答データを用意してください。例えば、CSVファイルに「回答」という列を作り、その列に自由回答を記入します。サンプルデータとしては、以下のような内容が考えられます。
回答
とても満足しています。
改善点がいくつかあります。
もっと多様な商品を扱ってほしい。
サービスは良好ですが、価格が高いと感じます。
ワードクラウドの生成
次に、Pythonを使用してワードクラウドを生成します。以下のスクリプトを参考にしてください。
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud
# CSVファイルからデータを読み込む
import pandas as pd
data = pd.read_csv('アンケートデータ.csv')
# テキストデータの結合
text = " ".join(response for response in data.回答)
# ワードクラウドの生成
wordcloud = WordCloud(width=800, height=400).generate(text)
# ワードクラウドの表示
plt.figure(figsize=(10,5))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis('off')
plt.show()
まとめ
この記事では、Pythonと自然言語処理を使用してアンケートの自由回答をワードクラウドで可視化する方法を紹介しました。この方法を用いることで、アンケート結果の分析がより直感的に、効率的に行えるようになります。
コメント