2018年12月17日 星期一

Siggraph Asia 2018 先進技術(Emerging Technologies)解析

「ACM Siggraph」是電腦圖學及人機互動最頂級的研討會,從1974年舉辦至今,主辦地幾乎都在美國,為了讓亞洲地區優秀的研究人員能就近參加,因此自2008年起另外成立「ACM Siggraph Asia」研討會,由亞洲、澳洲地區輪流主辦,其投稿難度亦不亞於「Siggraph」,今(201812/4~12/7)年度首次於東京舉辦。

Siggraph Asia研討會中除了精采的論文發表外,更有許多概念性的先進技術(Emerging Technologies)被推出,包括電腦圖學整合應用、人機互動裝置、實境互動(AR, VR, XR...)應用、特殊顯示器等項目。這個項目通常會吸引最多人駐足參觀,因為可以現場直接感受一下最具未來感的體驗。

今年「先進技術」項目共收錄了18組作品,其中有兩組來自台灣,台大、交大各一組,其餘都被日本學界和業界包辦,雖然往年日本在此項目為主要大宗,但今年竟然沒有其它國家作品入選,實在有點令人不解。今年官方釋出的影片只有收錄9組精采片段,而其它部份可能就得自行參閱官方網站了。接下來就依影片內容順序幫大家摘要一下這些精采作品的概念,希望能讓大家能對這些技術更多了解,如有個人認知錯誤或有其它看法歡迎留言一起討論。

Siggraph Asia 2018 Emerging Technologies 官方影片:

影片來源:Youtube (如遭移除敬請見諒)

2018年12月16日 星期日

Intel無人機Falcon 8+成功協助檢查美國老舊橋樑

大家都知道橋樑安全非常重要,但大家可能很難想像,這樣的工作常需要仰賴人力垂吊的方式進行目視檢查,這樣的作業模式不僅非常耗時、危險,有時還要阻斷交通才能施行,而且很難追蹤相同位置的狀況變化,因此就有人想到利用無人機來協助檢查橋樑的狀況,包括金屬鏽蝕、裂縫、傾斜等問題。

左圖:無人機檢查橋樑,右圖:傳統人力垂吊檢查橋樑 (點擊圖片放大)

松下(Panasonic)也來玩「拿了就走」的無人商店

2016年亞馬遜推出無人商店「Amazon Go」驚豔全世界,讓人有置身科幻電影中的未來超市,商品拿了就走,出了門口直接結帳扣款,完全不用店員介入。這樣的概念瞬間引起所有超市、超商重視,但了解其背後技術及要投入咋舌的金額後,大部份的商家就放棄這樣的念頭,進而改思考其它替代性方案。

Panosonic RFID自動結帳系統 (點擊圖片放大)

誰說椅子不能自動歸位呢?

「自動停車系統」和「掃地機器人」已不算是太神奇的技術了,但星爺說為什麼不摻在一起做「瀨尿蝦牛丸」呢?於是日產(Nissan)汽車就有了這項智慧自動歸位椅子(Intelligent Parking Chair)的技術誕生了。

日產(Nissan)汽車自動歸位座椅系統 (點擊圖片放大)

機器手臂也能像小嬰兒一樣抓自己想要的玩具了

小朋友滿周歲時大人們會準備各種物品讓小朋友「抓周」,再依小朋友抓到喜歡的物件來預測小朋友未來的職業,不知大家小時候都抓到些什麼東西呢?一歲小朋友的視力及手的運用能力大概已經可以簡單抓取想到的東西,尤其是食物,但小朋友的這項能力可不是大人教出來的,而是自己學習出來的。因此就有科學家想模仿小嬰兒的學習模式來讓機器人在沒人教(非監督學習)的情況下,學會如何抓到指定的物件,所以有了「Grasp2Vec」這項研究成果。


圖一 Grasp2Vec 系統圖 (點擊圖片放大)

2018年12月10日 星期一

機械姬(Naomi Wu)新作「AR變臉」

在創客界大概沒人不認識深圳這位人稱「SexyCyborg」的超級美女Naomi Wu吧!最近她又有新作「AR變臉」推出了,雖然沒有用到什麼高科技,但令人驚豔的視覺效果,還是忍不住想向大家介紹一下。

SexyCybrog Naomi Wu AR變臉 (點擊圖片放大)

2018年12月2日 星期日

走進虛擬實境(VR)世界的跑跑卡丁車

二十多年前台北大亞百貨公司(現台北火車站前亞洲廣場大樓)從日本SEGA引進台灣第一部具有實車操控的3D賽車遊戲機,其熱門的程度不輸今年公投的排隊盛況,對於當時還是學生的我,自然也不能缺席,雖然玩上一次就得花好幾天的吃飯錢,但那種隨著賽車過程產生的視覺效果加上車體加速搖晃及撞擊後產生的力道,至今實在難以忘懷。

近年來虛擬實境(VR)眼鏡技術成熟,為了讓遊戲更令人身歷其境及增加刺激感,於是開始把這種會隨遊戲內容改變座位角度、振動的機構加入遊戲中,除了賽車遊戲外像雲霄飛車、採礦車、勇士激流、飛行戰鬥、太空冒險等遊戲都很合適。但這些機構只能在原地搖晃,很難產生前後運動持續的加、減速度感,於是英特爾(Intel)、K1 Speed和Black Trax合作開發出了一套真實跑跑卡丁車(Go Karts)的VR遊戲,使用者可以戴上VR眼鏡在真實的小型賽車場上駕駛,享受奔馳在虛擬世界的快感。


神經計算棒大比拼

Movidius成立於2005年,專注於低功耗電腦視覺計算晶片開發,2016年正式被Intel收購。他們最著名的產品就是USB神經計算棒(Neural Compute Stick, NCS),又稱為VPU(Vision Processor Unit),其中主要晶片代號為Myriad 2(MA2x5x)。這項產品主要的特點就是USB型式,可插在執行Linux(Ubuntu)的桌上型電腦或嵌入式系統,尤其可支援創客最愛用的樹莓派,使其可以加速執行深度學習推論工作。

Intel Movidius NCS 2 (點擊圖片放大)

2018年12月1日 星期六

無人化餐廳時代真的到來了嗎?

這幾年隨著機器人技術、機器視覺、人工智慧及AI晶片的到位,加上人力成本越來越高,所以開始發展出許多「無人經濟」產業。其中以餐飲業最願意嚐鮮,率先導入無人(APP, ChatBot)定位點餐、自動帶位、送餐,甚至由機器人自動製作食物,最後再透過行動支付完成消費過程,從前台到後台幾乎全由機器人包辦,而服務人員的工作變成機器人保姆,確保它能正常工作,實在不知該說是進步還是悲哀。

今年阿里巴巴旗下「盒馬機器人餐廳」正式上線,才不到四個月就損益平衡(??自稱,不知折舊基準為何),其對手京東也不甘示弱推出「Joy's」無人餐廳,姑且不論是噱頭還是技術超前,其中許多技術仍值得我們多多學習。

接著就以盒馬機器人餐廳做為範例來說明。首先是選桌、掃碼點餐,可以透過店門口的大型觸控電子看板進行操作,亦可用手機操作,這些技術不管是前台或後台的資訊流管控對台灣公司來說是小菜一碟,沒有難度。接著入座後,後廚就緊鑼密鼓的作起菜來,當後廚將完成的菜放上自動送餐車後,不用一分鐘就可送到顧客面前,用餐後還可自動把餐盤載回清洗區,這項技術在以前可是像台積電這類的大公司才用的起的自動導引車(Automatic Guided Vehicle, AGV),如今變成隨手可得的技術。雖然裡面牽扯到許多機電整合、視覺導引、定位、工作分派等控制技術,但也還難不倒台灣的廠商,不過如何做出便宜好用、耐用的機器就變成門檻,不然這些軟韌硬體的投資不知何時才能攤平,會直接影響使用者投資意願。最後是結帳系統,透過行動支付系統就可輕易解決,而這個部份在台灣似乎還有一些法令問題尚待克服。

目前台灣的迴轉夀司店或直線式滑軌送餐系統已算常見,但還沒有看到這種大型的無人餐廳系統,綜合以上來說,整體的技術門檻不算太高,若有廠商願意投資開發再輸出到歐美等人力成本較高的國家,未來再結合線上、線下及大數據統計及商品推薦,相信應該可創造出更多商機。

盒馬無人餐廳自動送餐機器人,圖片來源 (點擊圖片放大)

AR眼鏡走入劇場感受不一樣的演出

2009年是3D電影開始發光發熱的一年,這一年「阿凡達」的大賣讓人們重新回到電影院感受不一樣的聲光效果,人們開始了解及習慣帶上一幅看起來很呆萌、笨重的眼鏡就能進入一個不一樣的世界。

為了讓3D視覺效果更身歷其境且能創造出更超現實的場景,虛擬實境(VR)眼鏡就成了不可或缺的工具,但這樣的影音效果如何呈現,可就苦了一堆導演,因為實在難以誘導觀眾將視線注意在想要表達的演員及物件上,更難產生傳統運鏡所能傳達的情感。另外對於觀眾而言除了配戴笨重的眼鏡的不舒適感外,過於強烈的視覺震撼及接近處於幽閉環境的感受也是讓大家不想輕易嚐試的一大難題。

於是有些人就想到利用擴增實境(AR)眼鏡走入劇場,讓觀眾可同時看到演員在表演,又可同時觀看(獲取)到額外的資訊或是意想不到的聲光效果,免除劇場對於佈景道具及聲光特效的安排,對於觀眾觀賞的舒適度有很大提升,且對於導演在劇情的安排、演員的走位及視覺特效也能更容易掌控。

接下來就以英國皇家劇院及以色列ARShow公司如何導入AR眼鏡到劇場做一簡單介紹。

一般聽障朋友到電影院看電影大概還不會有太大問題,因為有字幕可看,但他們可能很難到劇場看現場演出,因為他們看到的內容就像我們正常人在看默劇一樣,很難融入演出內容中。最近看到英國皇家劇院竟然結合EPSON AR眼鏡,讓聽障朋友也能即時看到演出字幕,實在是一項非常貼心的服務。演出過程中若不小心台詞和字幕不同步時,系統也會以最快時間重新同步,就像公車上報站系統不同步時司機會手動操作讓它前跳到正確位置。看來AR眼鏡的應用又多了一項,有興趣的朋友可參考下面CNN的新聞的連結。

AR 字幕眼鏡,圖片來源 (點擊圖片放大)

OpenCV 4.0千呼萬喚始出來

有在玩電腦(機器)視覺的朋友對開源電腦視覺函式庫「OpenCV」一定不陌生,從2000年發展至今已超過十八個年頭,中間歷經多次重大變革及分支,從2.2版開始支援C++,2.4版開始支援CUDA, OpenCL等加速工具,2.4.9版後本來進到3.0版停止支援C語言只支援C++,但許多仍在使用C語言的伙伴仍不離不棄,繼續將部份新增功能加入,於是劇情就展開成兩條支線,目前已來到2.4.13.6版,後續是否能繼續發展,實在令人擔憂。而3.0.0版於2015年正式推出,加入許多深度學習的工具,3.3版後更加入更多深度學習框架及算法如Caffe、Yolo等。最近(2018/11/20)正式推出4.0版更是讓人眼睛一亮,在深度學習部份有了重大改革,實在值得好好花點時間研究。

OpenCV演進歷史。OmniXRI Jack整理製作 (點擊圖片放大)

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務 開南大學...