6:00 PM - 6:20 PM
[3M6-OS-7c-02] Semantic Analysis and Visualization of Japanese-Chinese False Friends: A Cross-Linguistic Semantic Study
Keywords:Chinese and Japanese, Chinese characters, Natural language processing, Visualization
中国語と日本語は多くの漢字を共有し,同じ漢字の熟語も多い.例えば,「検討」「質問」「連想」などがある.だが,同じ漢字の熟語でも,中国語と日本語で意味が同じとは限らない.このような単語は同形異義語と呼ばれる.本研究の目的は,中国語と日本語の同形異義語の意味の違いにどのようなパターンがあるかを観察することであり,そのために可視化を適用する.本研究は3つのステップで構成される.まず,中国語と日本語の同形異義語とその意味をリストアップする.次に,SimCSEモデルを使って,これらの意味の文埋め込みを作る.そして,これらの文埋め込みを次元削減し,可視化する.この可視化を通じて,中国語と日本語の同形異義語の意味の違いにどのようなパターンがあるかを理解しやすくなる.さらに,可視化した結果をもとに,クラスタ分析を行い,その結果を分析する.本報告では,可視化とクラスタ分析から得られた面白い事例を紹介する.
Authentication for paper PDF access
A password is required to view paper PDFs. If you are a registered participant, please log on the site from Participant Log In.
You could view the PDF with entering the PDF viewing password bellow.