Cosero[1]是德國波恩大學的Sven Behnke團隊根據家庭環(huán)境中的日常操作任務而研制的一款仿人操作機器人(如圖1(a)(b))。機器人底部配備了四輪獨立轉向行走機構,以便在靈活的通過狹窄通道,上部配備了兩個7自由度機械臂已完成擬人的操作,并在夾持器末端裝有紅外測距傳感器已達到對抓取目標的距離探測,在頂端安裝有Kinect相機,以實現(xiàn)對目標環(huán)境的3D感知。Cosero通過底盤的激光雷達進行導航和定位,采用法線估計和場景分割相結合的方法對目標進行3D點云分割,采用無碰撞抓取方法[1]對目標物體進行抓取(如圖1(c)(d))。在論文[2]中,作者運用Cosero進行零件分揀搬運實驗,通過2D激光雷達導航到作業(yè)點,通過RGB-D相機對目標進行識別分割,規(guī)劃抓取路徑和抓取姿態(tài)估計(如圖1(e))。在論文[3]中,作者采用深度學習方法對目標進行姿態(tài)估計,并完成了提壺灌溉,人機交互和使用工具等復雜任務(如圖1(f))。Schwarz[4]介紹了Cosero基于深度學習方法的目標姿態(tài)估計和RGB-D SLAM等感知測量。
機器人、無人機、自動駕駛汽車等加快落地,智慧城市深入建設,更是為傳感器產業(yè)帶來了難以估量的龐大機遇
中國移動聯(lián)合產業(yè)合作伙伴發(fā)布《室內定位白皮書》,對室內定位產業(yè)發(fā)展現(xiàn)狀及面臨的挑戰(zhàn),深入分析了垂直行業(yè)的室內定位需求,并詳細闡述了實現(xiàn)室內定位的技術原理, 及室內定位評測體系
下一個十年,智能人機交互、多模態(tài)融合、結合領域需求的 NLP 解決方案建設、知識圖譜結合落地場景等將會有突破性變化
自然語言處理技術的應用和研究領域發(fā)生了許多有意義的標志性事件,技術進展方面主要體現(xiàn)在預訓練語言模型、跨語言 NLP/無監(jiān)督機器翻譯、知識圖譜發(fā)展 + 對話技術融合、智能人機交互、平臺廠商整合AI產品線
NVIDIA解決方案架構師王閃閃講解了BERT模型原理及其成就,NVIDIA開發(fā)的Megatron-BERT
基于內容圖譜結構化特征與索引更新平臺,在結構化方面打破傳統(tǒng)的數倉建模方式,以知識化、業(yè)務化、服務化為視角進行數據平臺化建設,來沉淀內容、行為、關系圖譜,目前在優(yōu)酷搜索、票票、大麥等場景開始進行應用
通過使用仿真和量化指標,使基準測試能夠通用于許多操作領域,但又足夠具體,能夠提供系統(tǒng)的有關信息
優(yōu)酷智能檔突破“傳統(tǒng)自適應碼率算法”的局限,解決視頻觀看體驗中高清和流暢的矛盾
姚霆指出,當前的多模態(tài)技術還是屬于狹隘的單任務學習,整個訓練和測試的過程都是在封閉和靜態(tài)的環(huán)境下進行,這就和真實世界中開放動態(tài)的應用場景存在一定的差異性
Tube Feature Aggregation Network(TFAN)新方法,即利用時序信息來輔助當前幀的遮擋行人檢測,目前該方法已在 Caltech 和 NightOwls 兩個數據集取得了業(yè)界領先的準確率
根據各種指法的具體特點,對時頻網格圖、時域網格圖、頻域網格圖劃分出若干個不同的計算區(qū)域,并以每個計算區(qū)域的均值與標準差作為指法自動識別的特征使用,用于基于機器學習方法的指法自動識別
新加坡國立大學NExT中心的王翔博士分析了知識圖譜在個性化推薦領域的應用背景,并詳細介紹了課題組在個性化推薦中的相關研究技術和進展,包括基于路徑、基于表征學習、基于圖神經網絡等知識圖譜在推薦系統(tǒng)中的融合技術