~ 3/13、LLMを用いたデータ生成や表記ゆれによるモデルへの影響について発表 ~

2025年3月10日(月)から14日(金)にかけて開催される『言語処理学会第31回年次大会(NLP2025)』にて、アクロクエストテクノロジー株式会社(本社:神奈川県横浜市・代表取締役:新免流、以下、アクロクエスト)に所属する、Kaggle Grandmasterの山本大輝と機械学習エンジニアの佐々木峻がポスター発表を行います。

「言語処理学会」は、言語処理に関する研究を行う日本の学術団体で、自然言語処理、計算言語学、言語情報処理などの分野を扱います。今回の『言語処理学会 年次大会』は、毎年3月頃に開催され、当該分野における最も重要な学術イベントの一つとして位置づけられています。

当社の山本大輝と佐々木峻は、この学会で、査読を 通過した以下の論文についてポスター発表を行います。

  1. 『表記ゆれが文埋め込みモデルに及ぼす影響についての考察』
    著者:佐々木峻、山本大輝
    論文:https://www.anlp.jp/proceedings/annual_meeting/2025/pdf_dir/P8-5.pdf
    RAGや文埋め込み検索が台頭する中、日本語検索では表記ゆれが課題となっている。本研究では単語の表記ゆれが文埋め込み検索の精度に与える影響を検証し、同義語辞書によるクエリ変換を用いた新手法を提案・評価する。
  2. 『少量ショットに対する大規模言語モデル(LLM)を用いた人工データ生成による精度向上の試み』
    著者:山本大輝、佐々木峻
    論文:https://www.anlp.jp/proceedings/annual_meeting/2025/pdf_dir/Q8-22.pdf
    LLMは自然言語処理で高い精度を示すが、高コストが課題。従来の手法はコストが低いが、データ不足で性能が向上しない。本研究では、LLMで学習データを生成し、軽量モデルの精度向上を目指した。実験で、参照なし文書生成プロンプトが最も効果的で、軽量モデルでも精度向上が確認された。

アクロクエストでも大規模言語モデル(LLM)の活用や、表記ゆれを含む文章への言語モデル対応に取り組んでおり、山本や佐々木自身が興味を持っている分野での発表です。

機械学習/AI、自然言語処理に関心をお持ちの方にたいへん有益なイベントとなっております。ぜひ、ご参加ください。

▼言語処理学会第31回年次大会(NLP2025)
https://www.anlp.jp/nlp2025/

日時:2025年3月10日(月)~3月14日(金)
会場:出島メッセ長崎
参加登録方法:上記URLより参加登録をしていただけます。

当社エンジニアのポスター発表スケジュール: 3月13日(木)8:30~10:00
P8-5 表記ゆれが文埋め込みモデルに及ぼす影響についての考察
   著者:佐々木 峻, 山本 大輝
Q8-22 少量ショットに対する大規模言語モデル(LLM)を用いた人工データ生成による精度向上の試み
   著者:山本 大輝, 佐々木 峻

※時間帯等は下記タイムテーブルよりご確認ください。
https://www.anlp.jp/proceedings/annual_meeting/2025/

<本件に関するお問い合わせ>
アクロクエストテクノロジー株式会社 広報担当/白井智子(しろいさとこ)

本件に関するお問い合わせは、以下のメール、またはお問い合わせフォームにてお願いいたします。

〒222-0033 神奈川県横浜市港北区新横浜3-17-2 友泉新横浜ビル 5階
E-MAIL(営業) : acropr@acroquest.co.jp

お問い合わせフォームはコチラ