AI Projects
漫畫修補 (Inpainting) & 漫畫復原 (Restoration)
Stable Diffusion, VAE
導入 Stable Diffusion 來進行漫畫的 inpainting 與 restoration,針對 Stable Diffusion 於漫畫上的種種問題進行修正,同時藉由 Stable Diffusion 的架構改良,讓內部的 VAE 能夠去除老化漫畫的髒污與泛黃特徵。
本研究藉由 User Study,證明了本研究的方法超越了以往的 inpainting 方法,包含:LaMa、Stable Diffusion、Xie et al. 提出的漫畫 inpainting 模型。
Ti-MAE & Transformer
Ti-MAE, Time Series, Transformer
Ti-MAE 是一個基於 Transformer 的時間序列分類模型,透過隨機生成遮罩進行自監督學習。此專案參考了論文,從頭於 PyTorch Lightning 實作了 Transformer 和 Ti-MAE 模型。
AI Smart Fast Forward
C++, Video
在 Skywatch 實習時做的專案,透過引入 AI 來提升智慧縮時的表現。智慧縮時是一個輸入 24 小時影片,可以輸出最長 10 分鐘影片的演算法。原本的演算法需要長時間的運算,並且會消酪大量記憶體。本專案藉由引入簡單的 AI,降低演算法對於雜訊的敏感度,同時最佳化演算法,讓運算速度大幅減少。
Image Similarity & Semantic Search
CLIP, Milvus Vector DB
一個透過 CLIP 與 Milvus Vector Database 實作的簡單相似影像搜尋系統,用戶可以透過文字描述想找的圖片,或是透過上傳圖片,來尋找相似影像。
Introduction : https://imrton.github.io/專案/ImageSimilaritySearch/
Skywatch 產品 QA 機器人
Llama 2, LLM, QLoRA
挑戰將 LLM 部署於 NVIDIA GeForce RTX 2070 8GB 消費級顯示卡上,並透過 finetune,讓模型可以回答 Skywatch 的產品問題。
具體是透過 GPT4 產生有關 Skywatch 產品問答的 dataset,並透過 Supervised Fine-tuning 調整基於 Llama 2-7B 的 Taiwan-LLM-7B 模型。
漫畫畫格 (Panel) 和對話框 (Speech Bubble) 的實例切割 (Instance Segmentation)
MViT, Detectron2, Instance Segmentation
透過 Detectron2 訓練一個基於 MViT 的實例切割 (Instance Segmentation) 模型,用來切割漫畫中的畫格 (Panel) 和對話框 (Speech Bubble)。
Car Detection and Removal of Landscape Scene
Mask-RCNN, Blender, 2D to 3D Projection
建築業在做地景重建時常遇到重建出來的街道場景過多雜物,如:汽車、機車、破碎號誌竿以及樹木等。因此在重建前,先透過深度學習(Mask-RCNN) 產生這些雜物的 Mask,在重建時就不會將這些空拍圖車輛的 Pixel 資訊納入重建。得以產出乾淨的 3D 街道場景。我們透過結合深度學習與 3D 重建的相機資訊,得以反推出 3D 場景中所有車輛的 Mask,達到幾乎 99% 的辨識率。
DLCV Projects
CNN & Semantic Segmentation
https://hackmd.io/@RTon/H1_Wtvcfs
- CNN t-SNE analysis
- Satellite Semantic Segmentation
DCGAN、WGAN、Diffusion Model & DANN
https://hackmd.io/@RTon/SJw676wms
- DCGAN
- WGAN
- Diffusion Model on MNIST dataset
- DANN t-SNE Results
| Type | Domain | Class |
|---|---|---|
| MNIST-M → SVHN | ![]() |
![]() |
| MNIST-M → USPS | ![]() |
![]() |
CLIP、Image Captioning
https://hackmd.io/@RTon/BkpQxeGHi
- Image Captioning
| CLIPScore | 0.8990 |
|---|---|
| Predicted | a person standing on a beach with colorful kite . |
| Ground Truth | a man is walking towards his kite on the ground. |
| Image | ![]() |
NeRF & Self-Supervised Learning
https://hackmd.io/@RTon/H1YkYXjUj
- DVGO Results

3D Semantic Segmentation
- Post
Graphics Projects
Incremental Instant Radiosity
Unity Engine, Ray Tracing, Radiosity
Interactive PailouModeling
Unity Engine, Procedure Modeling
2D to 3D Maze
OpenGL, Visible-Surface Determination
使用OpenGL 將左圖的2D 迷宮轉換成3D 版本,牆壁、顏色等都要自己計算,包含要畫在畫面上的哪個位置,且不能套用Z-Buffer 等OpenGL 3D 函式。
VFX Projects
HighDynamicRange-Imaging
Image Alignment using MTB, Solve Response Curve, Radiance Map, Tone Mapping
Calculate HDR image using multi-exposure images.
Introduction : https://imrton.github.io/專案/HDRImaging/
Source code : https://github.com/ImRTon/HighDynamicRange-Imaging
Image Stitching
SIFT
Combine a set of images into a larger image by registering, warping, resampling and blending them together.
Introduction : https://ImRTon.github.io/專案/ImageStitching/
Source code : https://github.com/ImRTon/VFX-ImageStitching
Game Projects
Tank Battle
Unity Engine, Third Person
Zombie Field 2022 - First Person Shooter
Unreal Engine 4, FPS
Hardware Projects
DIY Electric Scooter v4
3D Printing, Electric Circuit, Motor Control, Lithium Battery
改造自迪卡農滑板車 Town 7 XL,為一台輕量化可攜式的電動輔助滑板車,可折疊,全車重 < 8kg,易於攜帶。配有可抽換式電池,方便充電以及快速的電力補充。
Battery Pack of Electric Scooter
3D Printing, Electric Circuit, Lithium Battery
電動滑板車的電池組,由 6 顆 Sanyo NCR-20700B 鋰離子電池組成 12V 的電池系統,可外接 30W PD 充電器與 DC-DC 轉換電路,可提供 60W PD 輸出或是 20W Dash/VOOC 輸出。

3D Printed KartRider Race Car
3D Printing, 3D Modeling
透過 Autodesk Inventor 去建出跑跑卡丁車中的積木舒適 9 卡丁車。
準時睡鬧鐘 (黑客松 MakeNTU 2020)
Arduino, 24 Hours, 黑客松, MakeNTU
準時睡鬧鐘有幾項特點:
- 睡覺時間會響起鬧鈴,直到將手機放入充電。
- 於睡覺時間,無法打開拿取手機。
- 如有急迫需求使用手機,只能使用畫面上下顛倒,操作左右相反的觸碰筆。
- 從發想到實作皆於 24 小時內。
- 結合睡前充電的習慣。
在這聯網時代,手機變成什麼都可以控制,然而我們也捫心自問,手機是除了方便了生活,是否卻不方便了準時上床睡覺呢? 為了維持正常睡覺的習慣,為了不再因為一個通知而在床上划手機還不小心熬夜,這個鬧鐘會在設定的睡覺時間響起,提醒你該交出手機去睡覺,若還不照做就會一直吵你,還越來越吵煩到你受不了乖乖交出手機。怎麼知道你真的放下手機了? 這就得提到很多人使用手機的習慣⸺睡前充電,我們透過感測是否有充電,排除掉放入鬧鐘裡的東西不是手機。當放入手機並且按下右側睡覺鈕後,手機將會被關起來直到隔天設定的起床鬧鐘響起,才會退出來還給使用者。
在這個聯網時代,希望藉由這個「準時睡鬧鐘」,讓人們學習享受便利的同時,不會被手機所綁架而不方便最基本的睡眠。
智慧約束帶 (創創 AIoT 2022)
Arduino, App
與台科大醫工系和長庚科大護理系同學合作的比賽,作品是智慧約束帶,以氣囊和橫向電動馬達系統,智慧束縛患者,也透過 App 管理患者的狀況。結合以上,降低壓瘡的發生。獲得創創 AIoT 2022 佳作肯定。
被窩空調 (綠色生活創意競賽)
Arduino, App
與台科大電機和設計系同學合作的比賽,作品是被窩空調,透過水冷式的床墊和棉被來降溫,取代空氣降溫的空調,能夠更加節省能源。獲得佳作肯定。
動物森林 (與設計系合作之桌遊)
Arduino, 3D Printing, 3D Modeling
這是幫助設計系同學專題的作品,跳過遊戲規則以及概念設計部分。總之這是一款想要藉由卡牌,結合聲音互動的遊戲。主要的機電部分就是上方這顆方形的主機,透過感應卡片的RFID 辨認動物類別,在使用者壓下卡片時,會使這個裝置發出那個動物的叫聲,藉以使孩童去認識動物。當中設計系的同學提供這個產品的遊戲概念以及美觀部分,我與另一位電機系同學負責將機電部分實作與概念優化。因而最後產出了這個作品。




