2018年12月17日 星期一

Siggraph Asia 2018 先進技術(Emerging Technologies)解析

「ACM Siggraph」是電腦圖學及人機互動最頂級的研討會,從1974年舉辦至今,主辦地幾乎都在美國,為了讓亞洲地區優秀的研究人員能就近參加,因此自2008年起另外成立「ACM Siggraph Asia」研討會,由亞洲、澳洲地區輪流主辦,其投稿難度亦不亞於「Siggraph」,今(201812/4~12/7)年度首次於東京舉辦。

Siggraph Asia研討會中除了精采的論文發表外,更有許多概念性的先進技術(Emerging Technologies)被推出,包括電腦圖學整合應用、人機互動裝置、實境互動(AR, VR, XR...)應用、特殊顯示器等項目。這個項目通常會吸引最多人駐足參觀,因為可以現場直接感受一下最具未來感的體驗。

今年「先進技術」項目共收錄了18組作品,其中有兩組來自台灣,台大、交大各一組,其餘都被日本學界和業界包辦,雖然往年日本在此項目為主要大宗,但今年竟然沒有其它國家作品入選,實在有點令人不解。今年官方釋出的影片只有收錄9組精采片段,而其它部份可能就得自行參閱官方網站了。接下來就依影片內容順序幫大家摘要一下這些精采作品的概念,希望能讓大家能對這些技術更多了解,如有個人認知錯誤或有其它看法歡迎留言一起討論。

Siggraph Asia 2018 Emerging Technologies 官方影片:

影片來源:Youtube (如遭移除敬請見諒)

2018年12月16日 星期日

Intel無人機Falcon 8+成功協助檢查美國老舊橋樑

大家都知道橋樑安全非常重要,但大家可能很難想像,這樣的工作常需要仰賴人力垂吊的方式進行目視檢查,這樣的作業模式不僅非常耗時、危險,有時還要阻斷交通才能施行,而且很難追蹤相同位置的狀況變化,因此就有人想到利用無人機來協助檢查橋樑的狀況,包括金屬鏽蝕、裂縫、傾斜等問題。

左圖:無人機檢查橋樑,右圖:傳統人力垂吊檢查橋樑 (點擊圖片放大)

松下(Panasonic)也來玩「拿了就走」的無人商店

2016年亞馬遜推出無人商店「Amazon Go」驚豔全世界,讓人有置身科幻電影中的未來超市,商品拿了就走,出了門口直接結帳扣款,完全不用店員介入。這樣的概念瞬間引起所有超市、超商重視,但了解其背後技術及要投入咋舌的金額後,大部份的商家就放棄這樣的念頭,進而改思考其它替代性方案。

Panosonic RFID自動結帳系統 (點擊圖片放大)

誰說椅子不能自動歸位呢?

「自動停車系統」和「掃地機器人」已不算是太神奇的技術了,但星爺說為什麼不摻在一起做「瀨尿蝦牛丸」呢?於是日產(Nissan)汽車就有了這項智慧自動歸位椅子(Intelligent Parking Chair)的技術誕生了。

日產(Nissan)汽車自動歸位座椅系統 (點擊圖片放大)

機器手臂也能像小嬰兒一樣抓自己想要的玩具了

小朋友滿周歲時大人們會準備各種物品讓小朋友「抓周」,再依小朋友抓到喜歡的物件來預測小朋友未來的職業,不知大家小時候都抓到些什麼東西呢?一歲小朋友的視力及手的運用能力大概已經可以簡單抓取想到的東西,尤其是食物,但小朋友的這項能力可不是大人教出來的,而是自己學習出來的。因此就有科學家想模仿小嬰兒的學習模式來讓機器人在沒人教(非監督學習)的情況下,學會如何抓到指定的物件,所以有了「Grasp2Vec」這項研究成果。


圖一 Grasp2Vec 系統圖 (點擊圖片放大)

2018年12月10日 星期一

機械姬(Naomi Wu)新作「AR變臉」

在創客界大概沒人不認識深圳這位人稱「SexyCyborg」的超級美女Naomi Wu吧!最近她又有新作「AR變臉」推出了,雖然沒有用到什麼高科技,但令人驚豔的視覺效果,還是忍不住想向大家介紹一下。

SexyCybrog Naomi Wu AR變臉 (點擊圖片放大)

2018年12月2日 星期日

走進虛擬實境(VR)世界的跑跑卡丁車

二十多年前台北大亞百貨公司(現台北火車站前亞洲廣場大樓)從日本SEGA引進台灣第一部具有實車操控的3D賽車遊戲機,其熱門的程度不輸今年公投的排隊盛況,對於當時還是學生的我,自然也不能缺席,雖然玩上一次就得花好幾天的吃飯錢,但那種隨著賽車過程產生的視覺效果加上車體加速搖晃及撞擊後產生的力道,至今實在難以忘懷。

近年來虛擬實境(VR)眼鏡技術成熟,為了讓遊戲更令人身歷其境及增加刺激感,於是開始把這種會隨遊戲內容改變座位角度、振動的機構加入遊戲中,除了賽車遊戲外像雲霄飛車、採礦車、勇士激流、飛行戰鬥、太空冒險等遊戲都很合適。但這些機構只能在原地搖晃,很難產生前後運動持續的加、減速度感,於是英特爾(Intel)、K1 Speed和Black Trax合作開發出了一套真實跑跑卡丁車(Go Karts)的VR遊戲,使用者可以戴上VR眼鏡在真實的小型賽車場上駕駛,享受奔馳在虛擬世界的快感。


神經計算棒大比拼

Movidius成立於2005年,專注於低功耗電腦視覺計算晶片開發,2016年正式被Intel收購。他們最著名的產品就是USB神經計算棒(Neural Compute Stick, NCS),又稱為VPU(Vision Processor Unit),其中主要晶片代號為Myriad 2(MA2x5x)。這項產品主要的特點就是USB型式,可插在執行Linux(Ubuntu)的桌上型電腦或嵌入式系統,尤其可支援創客最愛用的樹莓派,使其可以加速執行深度學習推論工作。

Intel Movidius NCS 2 (點擊圖片放大)

2018年12月1日 星期六

無人化餐廳時代真的到來了嗎?

這幾年隨著機器人技術、機器視覺、人工智慧及AI晶片的到位,加上人力成本越來越高,所以開始發展出許多「無人經濟」產業。其中以餐飲業最願意嚐鮮,率先導入無人(APP, ChatBot)定位點餐、自動帶位、送餐,甚至由機器人自動製作食物,最後再透過行動支付完成消費過程,從前台到後台幾乎全由機器人包辦,而服務人員的工作變成機器人保姆,確保它能正常工作,實在不知該說是進步還是悲哀。

今年阿里巴巴旗下「盒馬機器人餐廳」正式上線,才不到四個月就損益平衡(??自稱,不知折舊基準為何),其對手京東也不甘示弱推出「Joy's」無人餐廳,姑且不論是噱頭還是技術超前,其中許多技術仍值得我們多多學習。

接著就以盒馬機器人餐廳做為範例來說明。首先是選桌、掃碼點餐,可以透過店門口的大型觸控電子看板進行操作,亦可用手機操作,這些技術不管是前台或後台的資訊流管控對台灣公司來說是小菜一碟,沒有難度。接著入座後,後廚就緊鑼密鼓的作起菜來,當後廚將完成的菜放上自動送餐車後,不用一分鐘就可送到顧客面前,用餐後還可自動把餐盤載回清洗區,這項技術在以前可是像台積電這類的大公司才用的起的自動導引車(Automatic Guided Vehicle, AGV),如今變成隨手可得的技術。雖然裡面牽扯到許多機電整合、視覺導引、定位、工作分派等控制技術,但也還難不倒台灣的廠商,不過如何做出便宜好用、耐用的機器就變成門檻,不然這些軟韌硬體的投資不知何時才能攤平,會直接影響使用者投資意願。最後是結帳系統,透過行動支付系統就可輕易解決,而這個部份在台灣似乎還有一些法令問題尚待克服。

目前台灣的迴轉夀司店或直線式滑軌送餐系統已算常見,但還沒有看到這種大型的無人餐廳系統,綜合以上來說,整體的技術門檻不算太高,若有廠商願意投資開發再輸出到歐美等人力成本較高的國家,未來再結合線上、線下及大數據統計及商品推薦,相信應該可創造出更多商機。

盒馬無人餐廳自動送餐機器人,圖片來源 (點擊圖片放大)

AR眼鏡走入劇場感受不一樣的演出

2009年是3D電影開始發光發熱的一年,這一年「阿凡達」的大賣讓人們重新回到電影院感受不一樣的聲光效果,人們開始了解及習慣帶上一幅看起來很呆萌、笨重的眼鏡就能進入一個不一樣的世界。

為了讓3D視覺效果更身歷其境且能創造出更超現實的場景,虛擬實境(VR)眼鏡就成了不可或缺的工具,但這樣的影音效果如何呈現,可就苦了一堆導演,因為實在難以誘導觀眾將視線注意在想要表達的演員及物件上,更難產生傳統運鏡所能傳達的情感。另外對於觀眾而言除了配戴笨重的眼鏡的不舒適感外,過於強烈的視覺震撼及接近處於幽閉環境的感受也是讓大家不想輕易嚐試的一大難題。

於是有些人就想到利用擴增實境(AR)眼鏡走入劇場,讓觀眾可同時看到演員在表演,又可同時觀看(獲取)到額外的資訊或是意想不到的聲光效果,免除劇場對於佈景道具及聲光特效的安排,對於觀眾觀賞的舒適度有很大提升,且對於導演在劇情的安排、演員的走位及視覺特效也能更容易掌控。

接下來就以英國皇家劇院及以色列ARShow公司如何導入AR眼鏡到劇場做一簡單介紹。

一般聽障朋友到電影院看電影大概還不會有太大問題,因為有字幕可看,但他們可能很難到劇場看現場演出,因為他們看到的內容就像我們正常人在看默劇一樣,很難融入演出內容中。最近看到英國皇家劇院竟然結合EPSON AR眼鏡,讓聽障朋友也能即時看到演出字幕,實在是一項非常貼心的服務。演出過程中若不小心台詞和字幕不同步時,系統也會以最快時間重新同步,就像公車上報站系統不同步時司機會手動操作讓它前跳到正確位置。看來AR眼鏡的應用又多了一項,有興趣的朋友可參考下面CNN的新聞的連結。

AR 字幕眼鏡,圖片來源 (點擊圖片放大)

OpenCV 4.0千呼萬喚始出來

有在玩電腦(機器)視覺的朋友對開源電腦視覺函式庫「OpenCV」一定不陌生,從2000年發展至今已超過十八個年頭,中間歷經多次重大變革及分支,從2.2版開始支援C++,2.4版開始支援CUDA, OpenCL等加速工具,2.4.9版後本來進到3.0版停止支援C語言只支援C++,但許多仍在使用C語言的伙伴仍不離不棄,繼續將部份新增功能加入,於是劇情就展開成兩條支線,目前已來到2.4.13.6版,後續是否能繼續發展,實在令人擔憂。而3.0.0版於2015年正式推出,加入許多深度學習的工具,3.3版後更加入更多深度學習框架及算法如Caffe、Yolo等。最近(2018/11/20)正式推出4.0版更是讓人眼睛一亮,在深度學習部份有了重大改革,實在值得好好花點時間研究。

OpenCV演進歷史。OmniXRI Jack整理製作 (點擊圖片放大)

2018年11月22日 星期四

【龍華資管專題演講】智慧商務-談開源的影像辨識玩法_課程簡報分享

很高興今天(2018/11/22)受龍華科大資管系馬芳資老師邀請到校和同學們分享「智慧商務─談開源的影像辨識玩法」。

此次主要分享內容首先介紹「無人商店」、「智慧零售」實際做法及所需技術,包括Amazon GO、7-11 X-Store、全家科技概念店、研華(Advantech)門店客流分析、創意引晴(Viscovery)、深智科技(NexRetail)、盾心(UmboCV)及商湯(SenseTime)等公司產品。接著說明人工智慧的基石、實施步驟和大數據之間的關連。再來介紹OpenCV, OpenVINO等開源影像辨識工具。最後介紹Amazon, Microsoft, Google提供的雲端AI服務、邊緣計算的平台及分享一個「老闆偵測器」的人臉辨識應用例給大家。希望藉由本次的分享,能讓同學們能更加了解如何應用這些工具來完成「智慧商務」。

※點擊圖片可放大觀看


2018年11月16日 星期五

【AI時代來臨】大數據應用實戰社群交流會_活動簡報

很高興此次能擔任2018/11/17(六)南科AI ROBOT社群開講第六場【AI時代來臨】大數據應用實戰社群交流會的主持人及其中一個講者並分享「AI大數據結合未來應用」。

大家都知道人工智慧要落地不只要有大數據還要有算法支撐,更重要的要有對應場景及領域知識才有可能成功。本次活動一共請到九位學有專精的產、學界專家共同分享其實務經驗,包括醫學、金融、視覺、農業、機械、互聯網、救災及語音等領域實務案例分享,內容相當精采,也讓我學習到更多,更多精采內容及各位講者簡報可至南科AI ROBOT自造基地社群論壇─智慧演算/FinTech主題論壇做進一步了解。以下就是此次分享的簡報內容,敬請參考!

※點擊圖片可放大觀看。


2018年11月8日 星期四

歐尼克斯實境互動工作室部落格及FB成立一週年

今天是本工作室部落格及FB成立一週年紀念,感謝大家的支持,短短一年這個部落格就獲得近九萬五千次的瀏覽率,雖然我知道Google Blog的計數方式有點灌水,可能會多個二、三倍出來(和Google Analytics比較),但我還是很高興大家願意花時間看我寫的文章。

FB部份這一年來增加了八十多位好友,另有一百多位追蹤者,讓我非常感動,因為以往我都是一個邊緣人,不太有人認識我。另外因為沒有設定社團或粉絲頁,所以難以統計按讚數量或分享次數,不過不管是多少,我一樣感謝您。

這一年來寫了七、八十篇文章和分享了十多篇的演講簡報,其中最受歡迎的題材還是人工智慧相關。而閱讀我文章的朋友大多是我從FB導流量過來的,中間還發生過大陸盗用文章的插曲。最近開始從Google搜尋引擎轉過來的連結開始變多,表示我寫的內容已開始有些關鍵字,讓大家可以搜尋到。

另外從觀眾流量排行榜來看,來自台灣、美國或中文系區域大致還能理解,但來自俄羅斯就很怪,經反查後發現連到一個俄羅斯入口網站(類似YAHOO),所以我想可能部份網頁瀏覽率可能有些來自機器爬蟲產生的吧?

未來我會繼續創作,希望大家能多多給我批評指教,這樣才有機會達到我心中最棒的台灣部落客Heresy's Space (https://kheresy.wordpress.com/) 九百萬的點擊率。


首頁及點擊率 (點擊圖放大)

十大點閱率排行榜 (點擊圖放大)

觀眾來源 (點擊圖放大)


2018年11月3日 星期六

OpenQPano開源360度顯示器

最近幾年一直和好友Ahow在研究如何完成360度裸視立體顯示器,期間雖然有開發出不少類型原型機(https://sites.google.com/site/zoevortex/),小到可以放在手上,大到等身高,也曾參展推廣相關技術,但受限於研發經費難以繼續開發出商用版本,所以一直停在原型機狀況。今(2018)年初看到有人在Kickstarter上集資想推出一個360度攝影機加360度顯示器及360度收音對話的智能音箱「Septaer」 (https://septaer.com/),於是激發我想把之前曾做過的桌上型360度顯示器精簡後開源出來。

最早的版本是用一台快二萬台幣的高亮度DLP迷你投影機經過凹、凸鏡組、反射鏡及特製的圓錐面鏡才能背投影在柱狀螢幕上(Fig.1左圖)。但是這個版本複製成本太高,於是第二版花了六千多台幣買了一台只比五十圓硬幣大一些的超迷你DLP高亮度投影機來製作,採取直接投影在圓錐面鏡方式完成背投影工作(Fig.1中圖)。雖然省去了透鏡組,但是特製的圓錐面鏡和柱狀背投方式在量產上還是需要很大模具費用支出。這兩種設計顯示上都是採無接縫方式顯示,甚至透過一些小技巧就能讓人產生極佳的立體視覺感受。當看到「Septaer」推出的概念後,忽然想到可以把原先的設計改成有接縫的六角柱方式,直接用六片LCD組成就可以達到360度顯示(Fig. 1右圖),雖然失去立體顯示的效果,但這樣的作法可以讓成本降到很低,而且可加入播放系統成為一體成型機,不用再外接電腦,讓一般Maker也能有機會在家動手重製,於是有了這個開源專案,稱之為「OpenQPano」。

Fig. 1 360度顯示器 (點擊圖放大)

2018年10月29日 星期一

美國FDA首次批准醫療AR解決方案OpenSight

2015年微軟推出第一款具有獨立作業系統(Win10)的擴增實境(AR)眼鏡「HoloLens」。它不僅擁有強大的運算能力,更有寬視角高解析度的半透顯示能力,同時具有多個攝像頭可進行場景3D掃描,並可直接由手勢操作顯示在半透明的頭罩上的虛擬物件,因此一推出就大受歡迎,教育、維修、設計、醫療等領域都有人投入開發相關應用程式。

目前醫生在進行外科手術時,通常旁邊都會有螢幕可即時看到病患之前的X光或斷層掃描(CT)影像方便醫生在動刀時能更精確斷定開刀部份。不過這樣的方式醫生常要一邊看螢幕一邊看開刀部位,實在很不方便,也不夠準確。因此當微軟推出HoloLens後就有很多廠商投入醫療用AR應用程式,希望令醫生可直接看到患者要開刀部位,並可同時疊加已3D建模好的醫療影像,如此就能更正確知道開刀位置及深度。

Novarad OpenSight 應用HoloLens的AR醫療技術。 圖片來源 (點擊圖放大)

2018年10月28日 星期日

LifePrint利用AR技術實現了哈利波特中會動的圖片

記得數位相機剛興起時我也買了一台送給愛拍照的父親,當時數位相片要分享給別人可不像現在有FB或LINE這麼方便,所以常要到相館把照片沖洗出來再送給別人,因此父親便成了相館的VIP。後來雖然自家有了高解析的彩色印表機和高品質的噴墨相紙可以輸出,但父親還是習慣到相館沖洗(輸出)相片,幾年前大家開始使用手機APP(LINE, FB...)拍照及分享後,就幾乎不再到相館沖洗照片了。

2015年「LifePrint」成功在KickStarter集資成功並在2016年開始供應隨身(微型)相片列印機,用以取代傳統拍立得及桌上型相片列印機,在當時掀起一股懷舊風,紛紛有廠商投入,變成朋友間增進情誼的最佳伴手禮,讓朋友間可以留住歡樂瞬間的影像。

LifePrint AR 照片列印機 圖片來源 (點擊圖放大)

天啊!HoloLamp怎麼把我的桌面變成立體顯示器了!

相信一般講到擴增實境(Augmented Reality, AR),我想大家大概都會想到拿著手機對著一個很像QR Code的圖標或一張特定的圖片轉來轉去,然後手機上就會出現一個可愛的3D公仔對著你裝萌,隨著你的手機前後、左右移動,那個3D公仔還隨手機的位置改變視角及大小,好像一個活生生的實體在你眼前。更進一步來看,當帶上像Google Glass, HoloLens, Meta2這類AR眼鏡時,使用者也可看到類似的效果。

從比較學術的角度來看,「擴增實境」從直接投影在視網膜到俗稱「光雕」直接投影在真實世界物體,反正只要把虛擬影像疊加在真實世界,讓眼睛同時看到,這樣的技術都可歸類在AR技術。

而擴增實境技術最主要由虛擬影像產生、顯示裝置及取像追蹤技術組成。首先找一個特定物件(一般為平面圖案)利用攝影機取得其影像並提取特徵點(如角點),接著計算攝影機視角(俯仰角、焦距)及距離,再依計算出的視角重新渲染(Render)繪製3D虛擬物件並合成至剛才取得的真實世界的影像,最後顯示顯示器或投影機上,如此就可讓虛實影像同時整合。

這樣的概念當然也可反過來使用,讓一台微投影機放在桌面特定高度向桌面投影,再依使用者觀常視角產生對應視點(角度及距離)的影像,如此就可令使用者看到非常逼真的3D立體影像,而不用配戴任何AR眼鏡。於是「HOLOLAMP」這家新創公司就推出這樣同名的產品,雖然不能說是最早有這種想法及實現這種概念的產品,但從展示影片來看其技術還是不錯的。

HoloLamp應用於點菜情境。圖片來源 (點擊圖放大)

2018年10月26日 星期五

無人化自動農場的時代即將到來了嗎?

台灣缺電問題一直是大家頭疼的問題,所以只好大家都「用愛發電」。現實中農業缺工問題更是日趨嚴重,國外有一家新創公司「Iron Ox」竟效仿台灣也來「用愛種菜」(GROWN BY ROBOTS WITH LOVE),推廣無人自動化種植及採收工廠,雖然還不到完全不用人力,但已明顯節省了許多人力。

IRON OX 搬運機器人ANGUS (點擊圖放大)

2018年10月24日 星期三

有了這技術從此簡報時不會再有人影擋住畫面了

相信很多人都有用投影機簡報的經驗,有時常會不小心走到投影機前,此時除了眼睛被投影機的強光照的很不舒服外,身體還會產生陰影擋住投影的內容,讓觀眾看不到投影的內容。為了解決這樣的問題,有些人可能會選擇短焦投影機,讓人不會擋到投影內容,但遇到大型投影內容時可能還是不容易處理。

最近韓國科技學院(KIAST)提出了一項可即時處理掉因人擋住投影產生的陰影問題。概念上很簡單,就是用二台以上投影機進行拼接投影,同時偵測人員距離投影機位置,並計算產生陰影的大小,然後去除會產生影子區域的投影內容,如此便不會產生影子。

Fig. 1 系統架構圖 (點擊後放大)

2018年10月21日 星期日

【AI_Column】運用Intel OpenVINO土炮自駕車視覺系統

這兩年人工智慧當道,無人自動駕駛汽車技術也隨之興起,我想超過四十歲的大叔們心中最完美的自駕車莫過於1980年代電視影集「霹靂遊俠」中李麥克開的那台「伙計」了。

「伙計」擁有高度人工智慧,不但可以自動駕駛,遇到狀況也會自動閃避,還可以輕鬆和人對話解決各種問題,李麥克拿起手表還可呼叫「伙計」開到指定地方,簡直就是現代人工智慧自駕車及語音助理的最佳範本!

不過自駕車這項技術聽起來就很難,那Maker們有沒有機會自己土砲一台呢?

1980年代經典電視影集「霹靂遊俠」李麥克和人工智慧自駕車「伙計」(圖片來源(點擊圖片放大)

2018年10月20日 星期六

如何移植Movidius神經計算棒到Pi Zero W

最近人工智慧(AI)當道,對於想學習及實作的Maker來說,樹莓派加上Intel Movidius神經計算棒(Neural Compute Stick,以下簡稱NCS)大概是最容易取得且最經濟的平台了。目前除了可直買到USB3.0版的NCS外,另外Google有提供AIY Vision Kit(Pi Zero W + Vision Bonnet),主要使用Pi Zero W及使用了和NCS相同計算晶片Intel Movidius MA2450的Vision Bonnet擴充板,舊的版本還得自己安裝一堆環境,新的1.1版買來組裝一下就可用了。加上最近Intel最近大力推廣它的OpenVINO,讓自家的CPU, GPU, FPGA, VPU(NCS主要晶片)能更容易跨平台,更適合開發AI終端(邊緣)應用裝置及程式。

Pi Zero W + Movidius Neural Compute Stick

2018年10月17日 星期三

【輔大-人人皆MAKER講座】開源的影像辨識玩法-從入門到進階_課程簡報

很高興今日(2018/10/17)受輔大創新造發展中心執行長王福堂助理教授邀請擔任「人人皆Maker講座」講師,分享「開源的影像辨識玩法─從入門到進階」。

此次主要簡報內容主要包括下列幾個項目,完整簡報請參考下方。
  • 認識影像辨識系統
  • 電腦視覺開源工具介紹:OpenCV、OpenVINO
  • 電腦視覺與人工智慧:常見視覺分析問題、深度學習與解決方案、應用場域
  • Maker如何玩影像辨識:入門 ─ 樹莓派、中階 ─ Intel神經計算棒、進階 ─ NVIDIA TX2、跨階 ─ 安卓手機+NNAPI
  • Maker創作經驗分享:OpenQCam 迷你相機、OpenQSignage 數位胸牌、OpenQPano 360度顯示器

※若看不清楚圖片內容,可點擊圖片放大至原始解析度觀看。


2018年10月14日 星期日

FBTUG FramHarvestBot專案設計解析_活動簡報

很高興今天(2018/10/13)受哈爸(FBTUG創辦人)及MakerPRO邀約至南科AI ROBOT自造基地分享最近參與的FBTUG子專案FarmHarvestBot的相關設計介紹。本次分享內容主要包括如何產生一個最小可行產品(MVP)概念,再從採收機器人的系統架構、硬體架構、軟體架構進行簡介,接著是分享網路上收集到的大量影片整理分類後所得的設計重點,分別從視覺、夾爪及機器手臂三大區塊作進一步說明。以下就是此次活動簡報,若有任何問題歡迎隨時在下方留言交流。

※若看不清楚圖片內容,可點擊圖片放大至原始解析度觀看。


2018年10月12日 星期五

手機到底要幾鏡頭才夠?(密集恐懼症者勿入)

每次一有新手機發佈,大家就會開始推估股王「大立光」的股價會漲還是會跌,因為每隻手機上最少都有前、後兩個鏡頭,知道手機銷售量加上市售率就可大致估出其產值及對應股價。雖然最近受智慧手機銷售量趨緩影響,但從最近發佈的幾隻多鏡頭手機來看,股王似乎又有機會更上一層樓了(大誤)。

早期手機為了取代數位相機拍照,所以搭配了一組後置相機(後鏡頭)。後來為了讓自己也能美美入鏡,於是又加了一組前置相機(前鏡頭)。幾年前立體電影當道,2012年HTC也曾出過雙後置相機(水平排列)可立體攝影及顯示的EVO 3D。2014年又找來五月天代言雙焦距後置相機(垂直排列)手機One M8,強調可模擬單眼相機才有的景深模糊效果及事後對焦功能。同時期各大手機場不約而推出各種後置雙鏡頭(垂直或水平排列)手機,以滿足手機近拍和廣角取景的需求。今(2018)年Hawei、Samsung、HTC、Sugar更是不約而同推出前後雙鏡頭的配置,以增加自拍合照時需要廣角取像的需求。

(點擊圖片後放大)

2018年10月10日 星期三

採收機器人_機器手臂篇

接連寫了「採收機器人_視覺篇」、「採收機器人_夾爪篇」後,大家應該對不同農作物的採收方式有了基本概念,接下來要繼續為大家整理採收機器人的機器手臂相關資訊。

一般所謂「機器手臂」可分為狹義的和廣義的定義。前者具有類似人類手臂、關節、手掌和手指的機器手臂,和後者只要具有能從有限空間中任意兩點進行移動、取放物件的機構裝置,不管外形和移動方式都可算是機器手臂。

常見機器手臂類型可分為下列幾大類。

2018年10月3日 星期三

戒指型滑鼠帶來擴增實境(AR)人機界面(HCI)操作新想法

今年八月終於看到花了七年燒了二十多億美金的Magic Leap推出其類光場擴增實境(Augmented Reality, AR)眼鏡Magic Leap One(以下簡稱MLO)。推出後不斷有令人失望的報導出現,甚至說它是世紀大騙局。隨著第三方軟體陸續開始支援後,我還是期待他們能有更好的產品及應用程式推出。

目前MLO雖然有支援手勢操作,但其操作精度及效果似乎和微軟的Hololens有類似問題,支援手勢種類、反應速度、操作精度及直覺性都不如人意,所以出貨時還是有搭配一組手把(搖桿),以便能像滑鼠有極佳地操控性。雖然個人覺得一個好的AR眼鏡最終還是要完全擺脫手把,但目前想要完全靠視覺辨識手勢確實也有點不容易。想像一下,帶個AR眼鏡出門結果還要拿個手把操作,這明顯就變得有點誇張也不切實際,難道就沒有更好的解決方式。

Scroll (點擊圖片放大)

2018年9月30日 星期日

【AI_Column】影像式AI虛擬助理真的要來了嗎?(下)

上一篇從影像式AI虛擬助理的應用場景以及關鍵技術進行討論,本文則著重在於市場趨勢發展,在目前市場發展的趨勢下,「語音助理」已經看似走到了瓶頸,而影像式AI虛擬助理是否能為「語音助理」帶來一道新的氣象?

從2D到3D的AI虛擬助理

2011年Apple Siri上市後,許多廠商就把較單純客服性質的對話服務移轉到具有聊天機器人的2D虛擬分身(Virtual Avatar)或稱虛擬助理(Virtual Assistant)、虛擬代理人(Virtual Agent)的系統上,但螢幕上虛擬人物最多只能點點頭、微笑說話,並不能有太多互動,且對話內容僅限服務項目。
後來許多網路攝影機(Webcam)廠商也陸續推出簡易型虛擬分身,讓使用者在網路上和其它人交流時可以不必顯示真面目,而以虛擬代理人顯示,此時的技術已可做到簡單的人臉位置追蹤及聲音驅動嘴形開合(嘴形和發音無關)。
近年來隨著人工智慧及智慧音箱技術的突飛猛進,因此影像式AI虛擬助理也隨之興起另一波風潮。以下就簡單盤點一下目前已發佈消息及已上市產品,包括日本Vinclu的Gatebox、韓國SK Telecom的HoloBox、美國DoubleMe的HoloTube、HoloDash及Samsung的Project Aurora。

互動式浮空投影機「Waiik」簡介

想必大家對電影「鋼鐵人」中那個神乎其技的浮空投影技術已經肖想已久了,但現實中那項技術幾乎作不到,因為很難讓光點停在半空中(除了電漿爆破技術外)。幾年前有人利用投影機投影在氣幕上就可達到類似浮空投影的視覺效果,但一台就要一到二萬美金,如今有人在知名集資網站Kickstarter上進行集資,這項名為「Waiik」的互動式氣幕投影機竟然一台只要不到七百美金,有興趣的朋友可以參考一下。

圖片來源 (點擊後放大圖片)

2018年9月28日 星期五

用AI來分類樂高積木

大家都有玩樂高積木的經驗,每次想找某一種形狀的積木時,總是要在一大堆積木中翻箱倒櫃才能找到,就不能玩完後自動歸類嗎?「科技始終來自於人(惰)性」,所以有人就做了一個樂高積木自動分撿器(LEGO Sorter)。

圖片來源 (圖片點擊後放大)

採收機器人_夾爪篇

最近在FarmBot Taiwan User Group (FBTUG)總召哈爸(許武龍)的號召下,各路高手紛紛跳坑,希望有機會發展出開源小型蔬果(蕃茄、甜椒、小黃瓜、咖啡豆等等)的採收機器人,以改善農民缺工問題及提升農業自動化技術。

採收機器人(HarvestBot)主要包含幾大部份,自走車(導航、定位)、機器視覺(果實空間XYZ位置、果實成熟度)、機器手臂(含爪子摘取、置放)及系統整合控制等部份。上一篇「採收機器人_視覺篇」已初步整理了一些影片,這次再接再厲把關於採收時夾爪的設計整理如下,希望能提供大家一些參考,相關說明僅個人透過影片觀察而得,若有說明不對的地方再請大家不吝指教。

2018年9月26日 星期三

【視覺進化論】AI視覺運算硬體加速可行方案評析_課程簡報

很高興本次受邀參加「AI視覺進化論─智慧視覺運算技術論壇」分享「AI視覺運算加速可行方案評析」。

本次主要內容包括四大部份,視覺問題分析及算法簡介(影像分類、物件偵測、語義分割、實例分割)、視覺運算開源工具及開放規格(OpenCV、OpenVX、OpenCL、OpenVINO)、視覺運算硬體加速方案(CPU, GPU, FPGA, ASIC, SoC)及OpenVINO支援項目(加速硬體、推論引擎、系統平台、預訓模型)介紹。相關簡報如下所示,如有任何筆誤或不清楚的地方,歡迎於下方留言交流。

<<如看不清楚簡報內容,可點擊圖片放大至原始解析度觀看。>>



2018年9月23日 星期日

「遊戲王」戰鬥卡牌AR桌遊真的來了?

小時候看了「遊戲王」那個戰鬥卡牌卡通後,就一直在幻想那個帥氣的浮空投影戰鬥場面何時才能在真實世界實現。幾年前「Pokemon GO」帶起了一波擴增實境(AR)遊戲風潮,雖然它不能算是真的AR應用,只是把神奇寶貝貼在真實場景畫面上,但多少也滿足了童年時那個卡通夢。

最近在集名集資網站Kickstarter上看到一個專案「Spatial」(已完成集資),竟有點小激動,因為它已非常接近「遊戲王」這種遊戲感覺,有卡牌,有浮空視覺效果,玩家可直接出牌就能在半透鏡上看到互動效果,再搭配搖桿操作就可進行更複雜的互動,完全就是「遊戲王」的翻版。


2018年9月18日 星期二

【AI_Column】影像式AI虛擬助理真的要來了嗎?(上)

語音助理發展至今,儼然已成了「超級紅海」,但下一個「藍海」在那裡呢?會是帶著顯示器的語音助理,甚至是擁有分身代理(Avartar Agent)具像化的虛擬(偶像)助理嗎?接下來就從應用場景、關鍵技術及市場趨勢來為大家說明。

應用場景

2011年Apple首先將語音助理Siri變成旗下iPhone等系列產品的標準功能,使用者可直接用語音查詢天氣及採購商品,還能陪你聊天。Amazon在2014年推出Alexa更進化到可以用語音控制家電,使得智慧家庭得以實現。而Google也不干示弱於2016年加入這個戰場,推出Google Home系列產品來應戰。加上大陸及台灣大廠及新創團隊的加入,語音助理這塊餅是越來越大,影像式的AI虛擬助理也逐漸出頭,先從電影裡一探AI虛擬助理的應用吧!
常看科幻電影的朋友,對2002年「時間機器」中圖書館員的橋段應該不陌生:1889年的亞歷山大駕著自己開發的時光機到了2030年的圖書館中想查資料,卻被眼前看似玻璃的顯示器中突然出現的虛擬圖書館員(VOX-114)嚇了一大跳,不但可以用真人形象出現,更能用流利的口語及豐富的表情和亞歷山大對話。

電影「時間機器」虛擬圖書館員場景(圖片截圖來源:https://youtu.be/CQbkhYg2DzM)

「新北市自造者嘉年華」參展感想

上週六、日(2018/9/15~16)「新北市自造者嘉年華」在新北市政府前廣場熱鬧展開。此次共有七十多個攤位,我們也有參與展出,感到十分高興。雖然第一天被「山竹」掃到颱風尾,風雨一陣一陣的,但還是有很多人不畏風雨前來參觀。第二天豔陽高照,參與的朋友就更多了,讓我們有機會把這些技術分享出去,並得到許多回饋,實在獲益良多。



2018年8月31日 星期五

靠磁力就能完成軟軟的機器人

一講到機器人,大多數人可能連想到的是像鋼彈、變形金剛這類雄狀威武型機器人,或者是像Pepper、Zenbo這類接近人形的服務型機器人,但很少人會想到機器人也可以像章魚一樣全身軟趴趴地緩慢前行。

 最近看到一個很有趣的專案,它利用國中時期學過的電磁鐵效應,就能用紙片做出一個會向前走的小機器人。原理超簡單,就是利用磁鐵「同極相斥、異極相吸」的特性來產生運動。首先到文具店買一塊超強磁鐵,再用漆包線繞成一個扁平狀的線圈,然後把一張不太厚的紙對摺,並將磁鐵和線圈分別貼在兩邊內側。當線圈通上直流電(電池)後就可產生磁場,若磁場方向方向就會排斥產生向前推擠運動,若將直流電反接後,產生相反磁場產生吸引動作,當線圈反覆給正負電流時就可讓這張人字形機器人向前走動了。若你想讓機器人看起來更可愛的話,那就畫上自己喜歡的圖案吧。


雖然說是機器人但實在有點陽春,若你能製作軟式電路板,並精密控制磁場變化,那就會得到如同章魚般的機器人,或者做出像昆蟲快速拍翅的動作甚至能飛起來,剩下的就靠大家的創意了。

如果有興趣的朋友可參考下列影片及網址。

2018年8月28日 星期二

採收機器人_視覺篇

最近在FarmBot Taiwan User Group (FBTUG)總召哈爸(許武龍)的號召下,各路高手紛紛跳坑,希望有機會發展出開源小型蔬果(蕃茄、甜椒、小黃瓜等)的採收機器人,以改善農民缺工問題及提升農業自動化技術。

採收機器人(HarvestBot)主要包含幾大部份,自走車(導航、定位)、機器視覺(果實空間XYZ位置、果實成熟度)、機器手臂(摘取、置放)等。在陳志弘大哥努力收集資訊下得到許多精彩的影片,希望藉此增加大家的認知,方便討論後續的設計方向。為了讓大家能更清楚相關技術,接著就先為大家介紹關於視覺部份,相關說明僅透過影片觀察而得,若有說明不對的地方再請大家不吝指教。

一、歐盟甜椒採收器人計畫 (Sweet Pepper Harvesting Robot) (2018)

這裡採用單攝影機方式,安裝在機器手臂爪子上,配合四盞高速閃光燈輪流快閃及機器手臂左右移動,來確認甜椒位置及是否完全成熟,主要是觀察色彩是否已大部份都已變黃色來決定。拍攝時會由下往上,左右搖擺鏡頭(夾爪)來檢查所有甜椒狀況。


(影片來源:Youtube)


2018年8月25日 星期六

【科技改變看得見】生活中的影像辨識交流論壇─OpenCV開源的影像辨識怎麼玩?_課程簡報

很高興今天(2018/8/25)到南科擔任【科技改變看得見】生活中的影像辨識交流論壇講者,分享「OpenCV開源的影像辨識怎麼玩?」這項主題。本次共有五位講者,所以我的部份僅有30分鐘,實在很難一次把OpenCV這個好用的工具完整介紹,只能先以較粗略方式介紹其概觀、歷史、用法及主要模組。同時藉知名電腦獨角獸「商湯科技(SenseTime Tech.)」的核心技術及應用場域來輔助說明電腦視覺可能的應用方式。最後再以一簡單案例OpenQCam來說明如何建構一套簡單的電腦視覺系統,最後再提供一些學習資源給大家。以下就是本次的簡報內容,如有任何問題歡迎留言交流。

<<如看不清楚簡報內容,可點擊圖片放大至原始解析度觀看。>>



2018年8月23日 星期四

「智能宗教」、「師父經濟」能救的了電子業嗎?

台灣電子業近幾年表現一直不如人意,毛利率從「毛三道四」搞到現在「坐二望一」,實在令人感到擔憂。前不久宏碁的「智慧佛珠」大賣,讓整個電子業大吃一驚,有如禪宗說的「頓悟」一般,原來一樣的技術賣到不同領域,自然就可以擺脫「紅海」,不用再斤斤計較生產成本,或許「智慧宗教」會變成下一個「藍海」。

宏碁智慧佛珠(圖片來源:電獺少女)

2018年8月18日 星期六

Magic Leap One 深度剖析

拿了投資者近26億美金的「Magic Leap」歷時七年多開發後最近終於開始將「Magic Leap One」(以下簡稱ML1)交到開發者手上進行實機測試,因此許多開箱文及影片陸續傳出,褒貶不一。雖然無緣成為第一批使用者,但前不久(2018/8/9)前也根據「What the Feature」所公開的影片及過往開發人機互動及使用過HoloLens經驗在FB上寫了一篇心得,獲得許多網友分享。這兩天又看到Lucas Rizzotto約15分鐘的試用影片及文章,覺得寫得相當不錯,於是我藉花獻佛將影片重點及個人心得整理一下分享給大家。

在Lucas Rizzotto的「Magic Leap One In-Depth Review」這個影片中,共分成六個項目進行解析,包括硬體、空間網格化及追蹤、操作系統、應用程式(APP)執行、WebMR瀏覽器(Helio)及視野(FoV)。接下來就依影片順序進行摘要並加上個人解讀。




2018年8月15日 星期三

SIGGRAPH 2018 先進技術(Emerging Technologies)解析

一年一度電腦圖學及人機互動領域最頂級的研討會「ACM SIGGRAPH 2018」這兩天(8/12~16)在加拿大溫哥華盛大舉行。此次不只聚集了全世界最頂尖的學術研究人員發表最新研究成果,更吸引眾多廠商展出相關技術,連NVIDIA執行長黃仁勳都親自前往推廣自家最新技術及產品。

由於個人對實境互動這個領域非常著迷,所以每年總會花點時間關注這個研討會相關技術的最新動態。除了相關論文外,個人尤其對「先進技術(EMERGING TECHNOLOGIES)」這個分項特別感興趣,因為這個項目綜合了最新技術及實機展示,同時提供參觀民眾感受最具未來感的體驗,比起那些充滿學術理論讓人暈暈欲睡的論文要有趣的多了。

今年「先進技術」項目共收錄了來自全世界24個團隊的展出項目,很可惜台灣今年無人上榜。雖然今年無緣前往實際體驗,但從先前官方釋出的影片就可看出相當精采,不過遺憾的是官方只收錄了8個項目的片段,其它部份可能就得自行參閱官方網站了。目前這些展出項目的正式論文尚未釋出,為了讓大家能更進一步了解影片中介紹的內容,以下僅就個人觀點做一點簡單摘要及說明,希望能讓大家能對這些技術更加了解,如有認知錯誤或有其它看法歡迎留言一起討論。

SIGGRAPH 2018 Emerging Technologies官方影片:



2018年8月3日 星期五

【南科AI_ROBOT Meetup】不再哭暈!光場顯示relax你的眼壓_課程簡報[1/2]

今天(2018/08/04)很高興受MakerPRO邀約到南科自造基地與大家分享光場攝影及光場顯示技術,同時介紹了FOVI3D及Magic Leap相關技術,以下就是此次課程簡報,請大家參考,如有不清楚或有筆誤的地方再請不吝指教。更進一步內容及相關參考網址請參考本文最後「進階閱讀」。

<<如看不清楚簡報內容,可點擊圖片放大至原始解析度觀看。>>


【南科AI_ROBOT Meetup】不再哭暈!光場顯示relax你的眼壓_參考影片[2/2]

今天(2018/08/04)很高興受MakerPRO邀約到南科自造基地與大家分享光場攝影及光場顯示技術,同時介紹了FOVI3D及Magic Leap相關技術,以下就是此次課程相關影片,請大家參考,如有不清楚或有筆誤的地方再請不吝指教。相關簡報連結及更進一步內容請參考本文最後「進階閱讀」。

幻影炫渦(ZoeVortex)工作室 360度子彈時間視覺特效產生器

 

2018年8月2日 星期四

一張解釋「過擬合」的有趣照片

今天在網路上看到一張解釋人工智慧中最常遇到的「過擬合(Overfitting)」問題,它非常有趣,不是用數學而是用一張床來解釋。我想看到的人都會會心一笑吧!這就是告訴我們資料集訓練過程百分之百正確,但實務上推論時卻不怎麼正確,就像這張床側睡時非常舒服完全貼身,但轉個身就掉到床下了。



ps. 一般解釋用圖如下:




2018年7月29日 星期日

下一個要流行的會是「人工智能虛擬助理」嗎?

最近看到一個新聞「30 萬日圓的 Gatebox 僅 2 萬就搞定?」本想有什麼驚人之作,這樣高度整合的技術竟如此簡單就被破解,沒想到只不過是用透明顯示器就搞定。回想我和朋友2014年參加Maker Fair Taipei時就DIY過一個用平板改裝的透明顯示器互動魚缸,早知道當年就搞個初音的影片來放,如今就不會有這條新聞。

【日本神人】影/高手在民間!30 萬日圓的 Gatebox 僅 2 萬就搞定? 網友:這不科學
https://www.limitlessiq.com/news/post/view/id/5754/


2018年7月24日 星期二

【AI入門】利用「深度學習」模型進行影像二元分類_簡報分享

今天(2018/7/23)很高興受MakerPRO邀約與大家分享如何利用Google Colaboratory (簡稱Colab)進行「深度學習」影像二元分類,以下就是此次課程簡報,請大家參考,如有不清楚或有筆誤的地方再請不吝指教。

<<如看不清楚簡報內容,可點擊圖片放大至原始解析度觀看。>>


2018年7月21日 星期六

【開發社群論壇】樹莓派GPU的算力釋放

很高興今天(2018/7/21)下午受邀出席MakerPRO舉辦的【開發社群論壇 ─ 打造AI邊緣運算之自造開發平台 】擔任講者,此次分享的主題是【 樹莓派GPU的算力釋放】。

此次主題顧名思義就是如何利用樹莓派的GPU來增加算力,用於影像處理及深度學習上,以下就是這次的簡報提供大家參考。

<<如看不清楚簡報內容,可點擊圖片放大至原始解析度觀看。>>


2018年7月9日 星期一

【AI_Column】AI 邊緣運算即將掀起風潮

今年Computex & InnoVEX 2018中可以嗅出一個方興未艾的風潮,那就是邊緣運算,本文將介紹邊緣運算為何興起,以及有哪些台灣廠商已推出相應的解決方案。
一年一度的Computex & InnoVEX 2018在不久前熱鬧閉幕,每年我總會撥個一、兩天去參觀,今年另外加碼了一天半參加了三場Computex Forum:「串聯AI生態系」、「遇見明日新科技」及「顛覆物聯新視界」,感受到不一樣的氣氛。
整體來說,從展場熱點來看個人電腦及週邊已有逐漸淡去的感覺,取而代之的是行動通訊、人工智慧、物聯網及相關的應用軟體等相關應用。尤其世貿三館的InnoVEX更是明顯,大多新創公司都展現出未來「萬物皆智能(AIoT = AI + IoT)」的趨勢。
不論是家電、交通、零售、虛擬擴增實境(AR/VR/XR)、人機互動、醫療、食安、農業、金融、安全監控、電商平台及城市環境等等,無一沒有智能管理、分析及預測。經過幾天的看展隱約嗅到一股風潮即將興起,那就是「邊緣運算」(Edge Computing)(也稱「邊緣計算」),為什麼這麼說呢?接下來就把此次看展的心得整理一下分享給大家。

2018年6月29日 星期五

【新竹創客講座】當AI遇到Maker,會迸出什麼火花?

很高興再一次受MakerPro邀請分享個人AI相關心得,本次講義內容大致上和之前二月在南科【一次搞懂!人工智慧能吃嗎?】那場類似,不過我更新了許多頁面,同時此次分享比較著重在後半段,會有較多的口頭說明,所以沒有現場參予的伙伴們,只能說聲對不起了。

另外本次分享內容中加入了最近我寫的幾篇文章,歡迎有興趣的伙伴們自行點閱下面連結:

人工智慧AI晶片與Maker創意接軌

深度學習,從「框架」開始學起

【Maker玩AI】使用Google Colaboratory免費資源學AI,正是時候!

※若看不清簡報內容時,煩請點擊圖片放大。


2018年6月27日 星期三

【Maker玩AI】使用Google Colaboratory免費資源學AI,正是時候!

去(2017)年科技部喊出臺灣正式進入「人工智慧(AI)元年」預計在五年內投入160億台幣。臺灣人工智慧學校在各大企業贊助及學研單位的投入教學下,經過三個多月密集培訓,已於今年四月底培訓出第一批五百餘名的技術及經理人員。
經濟部工業局也為了協助國內大型企業導入人工智慧技術,積極推動企業出題,新創團隊解題的「AI⁺ Solution Match人工智慧加值應用商業媒合」活動,並鼓勵各民間企業主動提出「AI主題式業界科專」。
在這種氛圍之下,身為創客的我們怎能錯過展現好點子落地的大好時機呢?接下來就為大家介紹如何取得及應用免費的AI實驗場域資源「Google Colaboratory」。

2018年6月25日 星期一

應用Google Colab免費GPU資源來完成影像二元分類

最近在朋友的推薦下得知Google竟有提供免費的GPU計算資源,雖然不算太大,但很適合入門的人練練手。我利用了Kaggle上的【Dogs and Cats】資料集及Colab提供的範例整理了一個完整說明的案例。

完整源碼請自行至 https://github.com/OmniXRI/Colab_Bin_Image_Classification 下載。


接著就帶著大家建構一個「深度學習」卷積神經網路(CNN)模型進行影像二元分類系統,主要包括下面四個步驟:
  1. 如何取得及建構訓練數據(Training Dataset) 
  2. 如何建構一小型深度學習模型(Training Model) 
  3. 如何訓練及驗證模型準確度(Valication Accuracy) 
  4. 如何應用深度學習訓練成果進行推論(Inference)

有興趣的伙伴,請將Github上「image_classification.ipynb」下載到您的Google雲端硬碟,雙擊後選擇以「Colaboratory」開啟,即可開始享受Google提供的免費GPU運算資訊,開始進入「人工智能」的領域。

如有任何問題歡迎在下方留言討論。

註:程式範例執行時,請按【Shift+Enter】進行單步執行並自動跳至下一行。若想一次全部運行本範例所有代碼,可按【Ctrl+F9】

延伸閱讀:【Maker玩AI】使用Google Colaboratory免費資源學AI,正是時候!

2018年6月5日 星期二

深度學習,從「框架」開始學起

目前當紅的人工智慧(Artificial intelligence,AI)主要聚焦在深度學習(Deep Learning,DL)領域,想學習深度學習技術的人,第一步通常會遇到一大堆框架(Framework)卻不知如何選擇,而究竟什麼是框架?框架如何用來表示模型?哪些才是主流框架?本文將會完整告訴你,協助找出最符合自己需求的框架。

何謂深度學習框架?


深度學習簡單示意圖。(圖片來源:廖庭儀製作)

2018年5月24日 星期四

人工智慧AI晶片與Maker創意接軌


近幾年來人工智慧(Artificial Intelligence, AI)喴的震天價響,吃也要AI,穿也要AI,連上個廁所也要來個AI智能健康分析,生活週遭食衣住行育樂幾乎無處不AI,彷彿已經來到科幻電影中的那個世界,面對這波「智能」新浪潮,身為Maker的我們自然不能缺席。本文將完整介紹AI晶片的發展,以及Maker們如何使用AI晶片與創作接軌。
AI這個領域看似深不可測,大家都說你得先學個線性代數、機率再加上一堆理論以及看了就頭疼的程式碼,再經過數年修練,就能小有成就。不過,大家請不必擔心,這些難的部份就先交給聰明的資料科學家和工程師,Maker們只要應用他們開發出的源碼及工具(SDK) 發揮創意專心創作出更具「智能化」的作品,解決更多人們的需求即可。
打個比方,「就像學開車不必先懂得車子如何設計,只需到駕訓班學基本原理、操作及交通安全規則就可上路了。」但是,如果你想精進駕駛技術,甚至當個專業賽車手或開發出專屬的車子,這時就必須更了解車子的設計原理,並學著如何改車及用何種方式駕駛,如此才能發揮車子的最大效能。

AI的應用不難,但想精通就得好好修練,就像除了知道怎麼開車以外,還需要知道車子的原理與架構

2018年4月30日 星期一

創客網紅(Maker Youtuber)大集合


Maker(創客)也可以是Youtuber(網紅)嗎?我想這應該也是一個先有雞還是先有蛋的問題。是創客佛心地分享做法才讓一堆粉絲追隨,還是為了想紅搞出一堆瘋狂的創作吸引大家的目光,我想兩者都有。不管是那種,都可讓我們在輕鬆娛快的氣氛下學習如何當個創客,何樂而不為。

想當Maker的人有很多種,有身懷絕技無處發揮的,有小白一個什麼都不會什麼都想學的,有想解決身邊問題但不知如何下手的人,也有為了增進親子感情全家玩在一起的,也有想驗證學校老師教的是否正確的,更有一些瘋狂想法想實現的人,不管你是那種,反正動手作就對了。以前阿媽時代縫紉機是必備的嫁妝,每個女生都會用縫紉機做衣服,但沒人會說自己是Maker,到了現在,大家都忘了動手作的樂趣,反而把這種動手做的精神叫做Maker,實在是一件很奇怪的事。不管你現在是不是Maker就從現在開始投入Maker的世界吧。

2018年3月23日 星期五

穿戴式顯示及互動專利分析

2012年Google Glasses造成一股AR眼鏡旋風,大家都希望從此可以過著如科幻電影般的隨心所欲獲取及處理數位資訊,可惜地是當年很多條件都不成熟,所以這項產品不到兩年就消失於市場。後來2015年微軟推出Hololens時重新以MR(Mixed Reality)商業術語(其實就是Strong Augmented Reality)包裝,同時兼具AR/VR效果,加上強力的3D掃描及手勢互動,的確又吸引了一波市場熱潮,但可惜的是單價太高(US$3000~5000)難以全面普及化。去年及今年隨著AI語音、影像辨識及3D感測器(光學)技術的成熟,加上市場謠言不斷APPLE即將推出AR眼鏡,因此可想見未來一、兩年內穿戴式顯示及互動技術又會變成顯學。

小弟2015年曾參加全國專利分析比賽並得了一個小獎,題目正是這個題材,當時光了二、三個月整理了一千多篇專利,並根據期望目標的限制收歛到69篇,最後再仔細閱讀後整理得到一些脈胳。雖然這份資料舊了些,但對有心入門了解的人可免去寶貴時間分析,藉由整理好的專利編號就可以順藤摸瓜,是很好的起頭。

2018年3月15日 星期四

AI智能虛擬助理介紹Gatebox/HoloBox/MxR Tube



2016年初日本廠商推出一台看似咖啡壺的AI虛擬助理原型機稱為Gatebox (Fig. 1a),這台機器可厲害了,浮空投影出一個3D動漫美少女管家,她不但會露出可愛的笑容問候你,眼神動作還會跟著你移動,最擅長唱歌跳舞,並且有像Siri的語音助理功能可以查詢天氣、控制家電等,還可以用手機APP和她連線,就像身邊多了一個貼心的女友,把你照顧的無微不至。2016年底開始接受預訂共300台,一台要價近三十萬日圓還是一掃而空。2017年底開始出貨,20183月再追加39台日本最紅的3D虛擬偶像「初音」版本。

受到Gatebox的刺激,台灣某大廠也曾找上我想開發此類產品,因為我的專長剛好包括此類相關機電光技術,但我只有簡單指導他們並無實際投入,不過至今仍未看到產品上市,我想這個案子大概胎死腹中了吧?

(2018)WMC中有兩家廠商不約而同推出了類似的產品的原型機,看來未來AI虛擬助理可能又會變成另一個戰場。首先幫大家介紹的是由韓國電信商SK Telecom 和技術團隊Reality Reflections共同打造的HoloBox和虛擬助理Wendy (Fig. 1b)。他們主打的功能除一般語音助理可以作到的功能外,另外虛擬助理還可提供一百多種表情還可辨識常用手勢用於控制系統。而其中的虛擬助理則是經由多達一百六十多台攝影機拍攝及數週時間的處理才得以產生的。
而另一家由英美韓組成的團隊DoubleMe則是推出了MxR Tube (Fig. 1c)。他們主要技術是直接快速360度全方位掃描人的動作(如跳舞、踢球等),經由內投影技術即可顯示3D真人動作,搭配簡單手勢操作就可旋轉觀賞視角,非常適合用於記錄特殊情境(如結婚、表演等)

Fig. 1 AI虛擬助理,(a) Gatebox[1](b) SK Telecom HoloBox[2](c)DoubleMe MxR Tube[3]

【頂置】簡報、源碼、系列文快速連結區

常有人反應用手機瀏覽本部落格時常要捲很多頁才能找到系列發文、開源專案、課程及活動簡報,為了方便大家快速查詢,特整理連結如下,敬請參考! Edge AI Taiwan 邊緣智能交流區 全像顯示與互動交流區 台科大(NTUST) 人工智慧與邊緣運算實務 開南大學...