视觉

作者: [db:作者] 分类: 奇闻 发布时间: 2025-01-21 13:39
视觉-言语年夜模子助力呆板人导航进级 愈加智能高效! 【CNMO科技新闻】据《中国经济网》报道,克日,喷鼻港科技年夜学(广州)李昊昂教学团队在呆板人导航技巧范畴获得了主要冲破,胜利研收回视觉-言语导航技巧,为呆板人供给了愈加天然、智能、高效的导航与交互才能。 传统的呆板人导航技巧重要依附纯视觉信息,如图像或视频,来懂得四周情况并计划门路。但是,在庞杂多变的情况中,这种导航方法每每存在范围性,招致呆板人导航才能缺乏。为了战胜这一困难,李昊昂教学团队研讨出了视觉-言语导航技巧,该技巧可能整合视觉信息及言语指令,实现高效的人机交互。 在效劳呆板人的利用中,该技巧使得呆板人可能懂得人类的言语指令,如“走到客堂,把餐桌上的苹果拿给我”,并经由过程视觉数据辨认要害信息,如“客堂”、“餐桌”、“苹果”等,从而正确地实现义务。这一技巧的实现,不只拓展了呆板人的利用场景,还进步了呆板人的任务效力跟保险性。 别的,针对现有视觉-言语年夜模子在信息保证方面存在的成绩,如对数据品质跟练习场景的敏理性、难以懂得含混言语指令等,李昊昂教学团队提出了面向视觉-言语导航利用的年夜模子调优战略。经由过程在呆板人室表里导航数据长进行视觉数据抽取跟言语指令标注,并对模子停止拟合,呆板人能够依据提取的情况视觉特点跟人类言语指令来决议其导航线径。 在数据基本方面,团队还经由过程仿真数据分解的方法处理了现有导航练习数据存在的成绩。他们计划了新鲜的天生式分散模子,能够分解大批、多样化、高品质的视觉数据跟相干的言语描写,从而无效增添练习数据的多样性,进步模子在处置庞杂、未见场景时的鲁棒性。版权全部,未经允许不得转载(本文来自于手机中国)

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!