このプレスリリースは機械翻訳されたものです。原文の言語版が優先されます。英語版を読む
日本・東京2024年12月13日
コアロボ合同会社(本社:京都府、代表:エル・ハフィ・ロトフィ。以下「当社」)は、当社代表社員&設立者のエル・ハフィ・ロトフィを共著者の一人とする論文が、2024年12月11日から13日にかけて東京にて開催された2024 IEEE International Conference on Robotic Computing(IRC 2024)におきまして、Best Paper Awardを受賞いたしましたことをお知らせいたします。 本国際会議は、米国電気電子学会(IEEE) が主催するものでございます。 表彰は、2024年12月13日の閉会式にて行われました。
受賞論文は、題目「Real-World Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning」 として、立命館大学の研究者らを主著者とする共著論文でございます。 本研究は、対照学習と事前学習済みの動きブレ除去モデルを組み合わせた、フューショット型のクロスクオリティインスタンス対応適応手法(CrossIA)を新たに提案するものでございます。 これにより、ロボットが観測する低品質画像と、ユーザーが提供する高品質クエリ画像との間に生じるドメイン間ギャップの解消を目指しております。 20種類のインスタンスを対象とした実環境におけるインスタンス特定型画像目標ナビゲーションタスクでの評価において、本提案手法は、既存手法と比較し、タスク成功率を最大3倍に向上させております。
実環境における画像目標ナビゲーションでは、ユーザーが撮影できる画像と、ロボットが実際に観測する画像との間の品質差が、依然として大きな課題となっております。本受賞は、その課題に対する実用的な一歩を評価いただいたものでございます。IEEE IRC 2024 Award Committeeの皆さま、ならびに立命館大学の共著者の皆さまに、改めまして深く御礼申し上げます。
当社は、本賞をお選びいただきましたIRC 2024 Award Committeeの皆さま、ならびに共著者および関係機関の皆さまに、改めまして深く御礼申し上げます。
引用情報
T. Sakaguchi, A. Taniguchi, Y. Hagiwara, L. El Hafi, S. Hasegawa, and T. Taniguchi, “Real-World Instance-specific Image Goal Navigation: Bridging Domain Gaps via Contrastive Learning,” in Proceedings of 2024 IEEE International Conference on Robotic Computing (IRC 2024), pp. 139-146, Tokyo, Japan, Dec. 11, 2024. DOI: 10.1109/IRC63610.2024.00032
概要
"Improving instance-specific image goal navigation (InstanceImageNav), which involves locating an object in the real world that is identical to a query image, is essential for enabling robots to help users find desired objects. The challenge lies in the domain gap between the low-quality images observed by the moving robot, characterized by motion blur and low resolution, and the high-quality query images provided by the user. These domain gaps can significantly reduce the task success rate, yet previous work has not adequately addressed them. To tackle this issue, we propose a novel method: few-shot cross-quality instance-aware adaptation (CrossIA). This approach employs contrastive learning with an instance classifier to align features between a large set of low-quality images and a small set of high-quality images. We fine-tuned the SimSiam model, pretrained on ImageNet, using CrossIA with instance labels based on a 3D semantic map. Additionally, our system integrates object image collection with a pretrained deblurring model to enhance the quality of the observed images. Evaluated on an InstanceImageNav task with 20 different instance types, our method improved the task success rate by up to three-fold compared to a baseline based on SuperGlue. These findings highlight the potential of contrastive learning and image enhancement techniques in improving object localization in robotic applications."
関連リンク
- IEEE Xplore 掲載論文: https://doi.org/10.1109/IRC63610.2024.00032
- arXivプリプリント: https://doi.org/10.48550/arXiv.2404.09645
- プロジェクトサイト: https://emergentsystemlabstudent.github.io/DomainBridgingNav/
- IEEE(公式サイト): https://www.ieee.org/
