[PA76] 大学授業シラバスデータを利用した自然言語処理
専修大学における経済系3学部の特徴の抽出と可視化
キーワード:自然言語処理, シラバス可視化, テキストマイニング
はじめに
専修大学には経済学部,経営学部,商学部の3学部が存在する。これら3学部はいずれも広い意味での経済系の学部であるため,受験生にとってはどの学部を志望するかに迷うことが考えられる。同様の学部形態を持つ大学として大阪大学の基礎工学部,工学部,理学部の存在が挙げられる。櫨畑 (2015)は主成分分析および正準判別分析の結果から,これら3学部の中で特徴的な講義を明らかにした。そこで本研究ではこの研究を参考に,専修大学における経済学系3学部の違いを明らかにし,各学部の特徴の可視化を目的とする。
方 法
3学部の1420講義のシラバスデータに対して形態素解析を行い,講義ごとの頻出単語の出現回数の集計表を作成した。その際,頻出単語に関して名詞以外の単語を除外した。また不要な名詞と思われる単語に関しても同様に分析対象から除外した。頻出単語の総数は138単語であった。次に集計表に対して,主成分分析を行った。最後に同様の集計表に対して正準判別分析を行った。
結 果
主成分分析を行った結果,第3主成分までの累積寄与率が10%であった。次に主成分分析のBiplotの結果および正準判別分析のプロット図を作成した(Figure1,2)。
Figure1より,第1主成分は数字を用いた講義か歴史を学ぶ講義かの軸であると解釈できる。第2主成分は,実践的な講義が図の上部に配置され図の下部には手法などの基礎的な講義が配置されていることから,実践・方法的かの軸であると解釈できる。
Figure2より,座標値0から離れている講義が各学部ごとに別々のまとまりを構成していることが示されている。
考 察
主成分分析の結果,経営学部の講義は数字を使用した講義が特徴として表れ,逆に経済学部の講義は歴史を学ぶような講義が特徴として表れた。
正準判別分析のプロット図より,各学部の特徴ある講義が存在していることが明らかになった。
経済学部に関しては,他の2学部に比べ特徴ある講義が多く存在した。主に,各国経済に関する講義が経済学部らしい講義と判断された。
経営学部に関しては,入門的・基礎的な講義が最も経営学部に特徴的な講義として表れた。
商学部に関しては他の2学部に比べ特徴ある講義が多くは表れなかったが,その中でも商品の価格を分析・計算する講義内容が特徴ある講義として表れた。
引用文献
櫨畑智公 (2015) 文脈を考慮した文書ベクトルの多変量解析によるシラバス可視化,卒業論文,大阪大学基礎工学部数理科学コース
専修大学には経済学部,経営学部,商学部の3学部が存在する。これら3学部はいずれも広い意味での経済系の学部であるため,受験生にとってはどの学部を志望するかに迷うことが考えられる。同様の学部形態を持つ大学として大阪大学の基礎工学部,工学部,理学部の存在が挙げられる。櫨畑 (2015)は主成分分析および正準判別分析の結果から,これら3学部の中で特徴的な講義を明らかにした。そこで本研究ではこの研究を参考に,専修大学における経済学系3学部の違いを明らかにし,各学部の特徴の可視化を目的とする。
方 法
3学部の1420講義のシラバスデータに対して形態素解析を行い,講義ごとの頻出単語の出現回数の集計表を作成した。その際,頻出単語に関して名詞以外の単語を除外した。また不要な名詞と思われる単語に関しても同様に分析対象から除外した。頻出単語の総数は138単語であった。次に集計表に対して,主成分分析を行った。最後に同様の集計表に対して正準判別分析を行った。
結 果
主成分分析を行った結果,第3主成分までの累積寄与率が10%であった。次に主成分分析のBiplotの結果および正準判別分析のプロット図を作成した(Figure1,2)。
Figure1より,第1主成分は数字を用いた講義か歴史を学ぶ講義かの軸であると解釈できる。第2主成分は,実践的な講義が図の上部に配置され図の下部には手法などの基礎的な講義が配置されていることから,実践・方法的かの軸であると解釈できる。
Figure2より,座標値0から離れている講義が各学部ごとに別々のまとまりを構成していることが示されている。
考 察
主成分分析の結果,経営学部の講義は数字を使用した講義が特徴として表れ,逆に経済学部の講義は歴史を学ぶような講義が特徴として表れた。
正準判別分析のプロット図より,各学部の特徴ある講義が存在していることが明らかになった。
経済学部に関しては,他の2学部に比べ特徴ある講義が多く存在した。主に,各国経済に関する講義が経済学部らしい講義と判断された。
経営学部に関しては,入門的・基礎的な講義が最も経営学部に特徴的な講義として表れた。
商学部に関しては他の2学部に比べ特徴ある講義が多くは表れなかったが,その中でも商品の価格を分析・計算する講義内容が特徴ある講義として表れた。
引用文献
櫨畑智公 (2015) 文脈を考慮した文書ベクトルの多変量解析によるシラバス可視化,卒業論文,大阪大学基礎工学部数理科学コース