~ 画像質問応答を大規模言語モデルを利用して解く論文を紹介 ~

アクロクエストテクノロジー株式会社(本社:神奈川県横浜市・代表取締役:新免流、以下、アクロクエスト)から、7月23日(日)に開催されたオンラインイベント『第59回 コンピュータビジョン勉強会@関東(前編)』の『CVPR(Computer Vision and Pattern Recognition Conference)2023 論文読み会』に機械学習エンジニアでKaggle Grandmasterの山本大輝が登壇しました。

「CVPR(Computer Vision and Pattern Recognition Conference)」は、その名の通りコンピュータビジョンとパターン認識に関する、重要な年次学会と位置づけられています。『CVPR 2023 論文読み会』はこの最新の学会論文の勉強会です。

当社の機械学習エンジニアでKaggle Grandmasterの山本大輝は、論文「Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering」から、画像に関する質問が与えられたときに回答を導くタスクである画像質問応答(Visual Question Answering)を大規模言語モデル(GPT-3.5)も使って解く最新手法について紹介しました。

イベントへの聴講募集には、約90人の応募があり、山本の発表では、技術的な仕組みに関する質問が多く寄せられ、活況となりました。

アクロクエストは今後も社員の積極的な勉強会等への参加を通じて、技術の発展に貢献してまいります。

▼第59回 コンピュータビジョン勉強会@関東(前編)
「CVPR(Computer Vision and Pattern Recognition Conference)2023」の論文読み会

https://kantocv.connpass.com/event/288899/

日時:2023年7月23日(日)13時00分~18時00分

※アクロクエスト 山本大輝(Kaggle Grandmaster、機械学習エンジニア)は発表者名「tereka114」で、「Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering」を紹介しました。

<論文URL>
Prompting Large Language Models with Answer Heuristics for Knowledge-based Visual Question Answering

https://t.co/GLMiXA1thV

※CVPR2023論文はこちらからダウンロードしていただけます。
https://openaccess.thecvf.com/CVPR2023

<山本発表資料>
https://speakerdeck.com/tereka114/prompting-large-language-models-with-answer-heuristics-for-knowledge-based-visual-question-answering

<本件に関するお問い合わせ>
アクロクエストテクノロジー株式会社 広報担当/白井智子(しろいさとこ)

本件に関するお問い合わせは、以下のメール、またはお問い合わせフォームにてお願いいたします。

〒222-0033 神奈川県横浜市港北区新横浜3-17-2 友泉新横浜ビル 5階
E-MAIL(営業) : acrosales@acroquest.co.jp

お問い合わせフォームはコチラ