2022年度 人工知能学会全国大会(第36回)

講演情報

一般セッション

一般セッション » GS-3 知識の利用と共有

[4N1-GS-3] 知識の利用と共有:社会応用

2022年6月17日(金) 10:00 〜 11:40 N会場 (Room 501)

座長:市川 淳(静岡大学)[現地]

10:40 〜 11:00

[4N1-GS-3-03] 令和版単語親密度に基づく大規模語彙数推定調査

Web公開版の利用ログ分析

〇藤田 早苗1、小林 哲生1 (1. NTT)

[[オンライン]]

キーワード:単語親密度、語彙数推定、利用ログの分析

我々は、語のなじみ深さを示す単語親密度を調査し、約163,000語からなる令和版単語親密度データベースを構築した。単語親密度にもとづいて調査語彙を選べば、少数の語を知っているかどうかを回答してもらうだけで、知っている語彙数の概算を推定することができる。
そこで我々は、令和版単語親密度に基づく語彙数推定テストを作成し、2020年6月4日からWebで公開している。公開から2年近くがたち、累計利用者は7万人を超えている。
本稿では、この語彙数推定テスト用の語の選択方法を紹介し、語彙数推定の方法を提案する。さらに回答ログを用いた語彙数推定結果の分析を行う。 特に、年代による語彙数の変化や公開している3つのテストによる違いを示す。

講演PDFパスワード認証
論文PDFの閲覧にはログインが必要です。参加登録者の方は「参加者用ログイン」画面からログインしてください。あるいは論文PDF閲覧用のパスワードを以下にご入力ください。

パスワード