精確的物體姿態(tài)估計是指機器人同時確定物體的位置和方向的能力。這對機器人技術(shù)十分重要,尤其是在對制造和物流等行業(yè)非常關(guān)鍵的拾取和放置任務中。隨著機器人承擔的復雜操作任務越來越多,它們?nèi)找嫘枰哂芯_確定物體、位置和方向的六個自由度(6D姿態(tài))的能力,以確保能夠以可靠和安全的方式與物體進行交互。盡管深度學習取得了進步,但6D姿態(tài)估計算法的性能在很大程度上取決于其訓練數(shù)據(jù)的質(zhì)量。
(圖片來源:芝浦工業(yè)大學)
據(jù)外媒報道,在由日本芝浦工業(yè)大學(Shibaura Institute of Technology)副教授Phan Xuan Tan領(lǐng)導一項新研究中,研究人員引入精心設(shè)計的數(shù)據(jù)集,旨在提高6D姿態(tài)估計算法的性能。該數(shù)據(jù)集通過提供全面的資源,允許機器人在現(xiàn)實環(huán)境中以更高的精度和適應性來執(zhí)行任務,從而彌補機器人抓取和自動化研究中的主要空白。該團隊還包括來自河內(nèi)工業(yè)大學(Hanoi University of Industry)和河內(nèi)理工大學(Hanoi University of Science and Technology)的研究人員。
芝浦工業(yè)大學副教授Phan Xuan Tan表示:“研究人員的目標是創(chuàng)建一個數(shù)據(jù)集,不僅可以推進研究,而且可以解決工業(yè)機器人自動化方面的實際挑戰(zhàn)。我們希望它能為研究人員和工程師提供寶貴的資源。”
該團隊創(chuàng)建的數(shù)據(jù)集不僅可以滿足研究社區(qū)的需求,而且適用于實際的工業(yè)環(huán)境。使用Intel RealSense depth D435攝像頭,它們可以收集優(yōu)質(zhì)RGB和深度圖像,并通過物體6D姿態(tài)數(shù)據(jù)旋轉(zhuǎn)和平移分別進行注釋。該數(shù)據(jù)集具有各種形狀和大小的特征,并添加了數(shù)據(jù)增強技術(shù)以確保其在不同環(huán)境條件下的多功能性。這種方法使該數(shù)據(jù)集高度適用于廣泛的機器人應用。
Tan副教授表示:“該數(shù)據(jù)集經(jīng)過精心設(shè)計,適合各個行業(yè)。它包含具有不同形狀和環(huán)境變量的物體,不僅為研究人員提供了寶貴的資源,也使相關(guān)領(lǐng)域(機器人需要在動態(tài)和復雜條件下運行)工程師受益。”
通過最先進的深度學習模型EfficientPose和FFB6D進行評估,該數(shù)據(jù)集分別達到了97.05%和98.09%的準確率。這證明它可以提供可靠和精確的姿態(tài)信息,對于機器人操作、制造業(yè)質(zhì)量控制和自動駕駛汽車等應用十分重要。這些算法在數(shù)據(jù)集上的強大性能,突顯了對需要精確度的機器人系統(tǒng)進行改進的潛力。
Tan副教授表示:“該數(shù)據(jù)集包括一系列基本形狀,包括長方體、梯形和圓柱體。對其進行擴展以包含更復雜和不規(guī)則的物體,將使其更適用于現(xiàn)實世界的場景。Intel RealSense Depth D435攝像頭可以提供出色的深度和RGB數(shù)據(jù),但該數(shù)據(jù)集對它具有依賴性,無法使用相同設(shè)備的研究人員可能訪問受限。”
盡管存在這些挑戰(zhàn),但研究人員對該數(shù)據(jù)集的效用持樂觀態(tài)度。結(jié)果表明,良好的數(shù)據(jù)集設(shè)計可以明顯提高6D姿態(tài)估計算法的性能,從而支持機器人以更高的精確度和效率執(zhí)行更復雜的任務。展望未來,通過整合更廣泛的物體和自動化部分數(shù)據(jù)收集過程,該團隊計劃擴展數(shù)據(jù)集,以使其更高效和易于訪問。他們希望進一步增強該數(shù)據(jù)集的適用性和實用性,使依賴于機器人自動化的研究人員和行業(yè)受益。