近日, GSXR重要成員NOLO在其自媒體賬號(hào)發(fā)布了其關(guān)于手勢(shì)識(shí)別技術(shù)的演示片段。從視頻內(nèi)容可以看出,工作人員佩戴NOLO即將發(fā)售的設(shè)備NOLO SONIC 2,裸手流暢的進(jìn)行點(diǎn)、按、捏、拖拽、滑動(dòng)等動(dòng)作。NOLO官方表示該項(xiàng)技術(shù)不僅搭載于NOLO SONIC 2設(shè)備,還將對(duì)外開發(fā)合作。憑借更加自然和直觀的操作方式,NOLO的手勢(shì)識(shí)別技術(shù)將作為GSXR標(biāo)準(zhǔn)下交互輸入的技術(shù)方案的新范式補(bǔ)充。
2021年3月,由中國(guó)移動(dòng)牽頭,聯(lián)合產(chǎn)業(yè)伙伴發(fā)起的中國(guó)XR通用標(biāo)準(zhǔn)(GSXR)正式對(duì)外發(fā)布,并在CCSA擴(kuò)展現(xiàn)實(shí)產(chǎn)業(yè)及標(biāo)準(zhǔn)推進(jìn)委員會(huì)引領(lǐng)下在產(chǎn)業(yè)中快速推廣,該標(biāo)準(zhǔn)旨在構(gòu)建起中國(guó)的XR跨平臺(tái)互通體系,使得行業(yè)參與者基于該標(biāo)準(zhǔn)開展硬件、平臺(tái)、內(nèi)容開發(fā),即可確保所開發(fā)的軟件應(yīng)用均可運(yùn)行在針對(duì)該標(biāo)準(zhǔn)做過(guò)適配的硬件上。此標(biāo)準(zhǔn)的正式施行極大的降低了XR軟硬件適配難度,加速推動(dòng)了行業(yè)發(fā)展。
GSXR標(biāo)準(zhǔn)的正式實(shí)施,不僅為XR行業(yè)提供了通用接口規(guī)范,降低了開發(fā)者接入成本;同時(shí)將軟件功能集成SDK的形式,服務(wù)于XR行業(yè)。
騰訊搜狗輸入法正是通過(guò)此種路徑成為GSXR標(biāo)準(zhǔn)內(nèi)首個(gè)「中文輸入」解決方案,也是標(biāo)準(zhǔn)內(nèi)重要的人機(jī)交互解決方案之一。騰訊搜狗輸入法為XR系統(tǒng)提供專屬、智能和高效的語(yǔ)音輸入和鍵盤輸入模式,還能能根據(jù)系統(tǒng)輸入框類型匹配多形態(tài)鍵盤。其中行業(yè)首創(chuàng)的語(yǔ)音輸入,讓用戶解放雙手,動(dòng)動(dòng)嘴就能打字;搜狗通過(guò)軟硬件結(jié)合的方式進(jìn)行創(chuàng)新,優(yōu)化手柄輸入體驗(yàn),提升輸入效率;結(jié)合手勢(shì)算法能力,還可進(jìn)行裸手輸入,讓用戶體驗(yàn)到更沉浸,更智能的輸入方式。當(dāng)下搜狗VR輸入法已服務(wù)于中國(guó)XR行業(yè)的硬件產(chǎn)品,并在中國(guó)移動(dòng) x NOLO聯(lián)合品牌VR終端中作為首個(gè)基線產(chǎn)品實(shí)現(xiàn)應(yīng)用落地。
NOLO發(fā)布的手勢(shì)追蹤技術(shù)同樣基于GSXR標(biāo)準(zhǔn)協(xié)議研發(fā),開發(fā)者可以通過(guò)GSXR的通用API接口,使用XR特性模塊中的手勢(shì)識(shí)別、骨骼節(jié)點(diǎn)、捏合姿態(tài)、手部追蹤等功能用于XR應(yīng)用開發(fā)。同時(shí),為了方便開發(fā)者快速上手開發(fā)XR應(yīng)用,GSXR提供了Unreal SDK、Unity SDK詳細(xì)的說(shuō)明文檔以及論壇討論功能。對(duì)接完畢后,用戶可在XR設(shè)備內(nèi)實(shí)現(xiàn)裸手進(jìn)行點(diǎn)、按、選擇、拖拽等更加自然和沉浸的操作。
提及該項(xiàng)技術(shù)的研發(fā)過(guò)程,NOLO相關(guān)技術(shù)負(fù)責(zé)人表示:“NOLO技術(shù)團(tuán)隊(duì)?wèi){借人工智能的深度學(xué)習(xí)技術(shù),借助真實(shí)手部圖像和3D生成手部圖像進(jìn)行數(shù)據(jù)融合訓(xùn)練。用數(shù)百萬(wàn)張手部圖像訓(xùn)練了一個(gè)專門的深度神經(jīng)網(wǎng)絡(luò),其中手腕和手指擁有3D空間位姿;由此生成的手勢(shì)數(shù)據(jù)通過(guò)GSXR協(xié)議傳輸?shù)?D圖形引擎渲染,再顯示到VR眼鏡中,最終達(dá)成了現(xiàn)實(shí)世界和VR世界的手勢(shì)同步。同時(shí)為了保證識(shí)別的實(shí)時(shí)性,NOLO深度優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),保障在驍龍XR2芯片上單幀識(shí)別速度達(dá)到5ms以下;深度學(xué)習(xí)算法通過(guò)動(dòng)態(tài)提取多幀數(shù)據(jù)中的手勢(shì)信息,提高動(dòng)作連貫性,以此達(dá)到流暢絲滑的識(shí)別效果!
對(duì)于該項(xiàng)技術(shù)是否對(duì)外開放,NOLO相關(guān)負(fù)責(zé)人表示:“該項(xiàng)手勢(shì)追蹤技術(shù)除了用于NOLO SONIC 2,以不斷豐富用戶的體驗(yàn)感受。作為GSXR工作組的一員,我們持開放的態(tài)度,將此技術(shù)合作開放給CCSA擴(kuò)展現(xiàn)實(shí)產(chǎn)業(yè)及標(biāo)準(zhǔn)推進(jìn)委員會(huì)的成員,助力中國(guó)XR產(chǎn)業(yè)的快速發(fā)展。”
GSXR標(biāo)準(zhǔn)已執(zhí)行2年,CCSA擴(kuò)展現(xiàn)實(shí)產(chǎn)業(yè)及標(biāo)準(zhǔn)推進(jìn)委員會(huì)將進(jìn)一步推動(dòng)擴(kuò)展現(xiàn)實(shí)標(biāo)準(zhǔn)實(shí)施與落地,研發(fā)適合產(chǎn)業(yè)發(fā)展的測(cè)試解決方案,開展產(chǎn)品的測(cè)試認(rèn)證,探索新應(yīng)用模式,服務(wù)應(yīng)用開發(fā)者,建設(shè)健康可持續(xù)的產(chǎn)業(yè)生態(tài)。接下來(lái),中國(guó)移動(dòng)(終端公司及咪咕文化)將依托GSXR統(tǒng)一標(biāo)準(zhǔn),匯聚全領(lǐng)域內(nèi)容,提供“標(biāo)準(zhǔn)-內(nèi)容(應(yīng)用)-平臺(tái)”的一站式服務(wù),打造“一個(gè)平臺(tái)、N個(gè)內(nèi)容資源、N個(gè)應(yīng)用服務(wù)”的“1+N+N”服務(wù)體系,對(duì)外開放XR通用能力,提供端到端的解決方案。從標(biāo)準(zhǔn)、內(nèi)容、終端等多方面,構(gòu)建全領(lǐng)域XR矩陣,將XR技術(shù)賦能應(yīng)用在教育、醫(yī)療、工業(yè)、體育、演藝等多個(gè)領(lǐng)域與場(chǎng)景。并以開放的態(tài)度,與產(chǎn)業(yè)伙伴一道共同建設(shè)健康的XR大生態(tài),助力中國(guó)XR產(chǎn)業(yè)快速發(fā)展。