fbpx

MCU 728x90 114

2024data ml resultpost banner

本班介紹 活動議程 專題介紹 歷屆成果展

2024data ml course menu

2024 data ml student

 

學員將於活動中簡報專題發想動機、技術架構、開發心得、預計成果等,並於簡報後和現場企業來賓進行交流。 歡迎AI人工智慧、機器學習開發、嵌入式系統開發、韌體開發等技術領域相關企業蒞臨交流。

艾鍗辦訓,秉持著「為用而訓」之原則,幫助學員培養符合業界所需的職能。本此成果展的班隊為數據分析暨機器學習應用班。學員們經過3個多月的紮實的實作學習,產出「為用而生」的技術作品,迫不及待向企業夥伴們展現心血成果。本活動免費,歡迎企業廠商到場來交流喔!

TIMEDESCRIPTION
13:10-13:30 來賓報到
13:30-14:10 來賓致詞、專題指導老師致詞
14:10-15:10 學員進行專題簡報
► SwiftCar - 基於行動端 YOLOv8 的即時視覺辨識結帳系統
► 台股指數預測系統:結合 XGBoost 與 Bert 的股市智慧預測系統
► 智慧本壘板:基於 Few-Shot LLM 的自動化棒球賽事紀錄與可視化
► AI 虛擬衣櫥:高保真虛擬試穿平台
► 基於生成對抗網路的深度學習聲音降噪系統
15:10-15:20 休息茶敘時間
15:20-16:30 成果展示、學員與廠商交流時間
16:30-17:00 學員結訓、賦歸

活動時間

114年09月26日 (五) 下午13:30~16:30

活動地點

文大推廣部大安分部-406教室(台北市大安區和平東路一段155號4樓)

活動報名

聯絡窗口:張先生 Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它 | (02)2316-7734

113 data ml resultpost banner1

組員:李○興、林○敬、林○卉、粘○瑋、吳○諺
摘要

在全球零售巨頭如 Amazon、Walmart 與 7-Eleven 相繼導入「掃碼購 (Scan & Go)」服務的浪潮下,傳統結帳模式正面臨顛覆性轉型。這些成功案例證明,將結帳流程轉移至消費者的手機端,不僅能有效縮短排隊與結帳時間,更顯著提升購物體驗。受此趨勢啟發,本專案 「SwiftCart」 致力於打造一套輕量、高效的 AI 影像辨識結帳解決方案,協助更多商家以低門檻導入智慧零售模式。


本專案核心是一套可部署於行動裝置的即時商品視覺辨識系統。我們採用先進的 YOLOv8 物件偵測模型,並將推論計算直接置於手機端 (On-Device Inference),成功擺脫對網路連線的依賴,實現零延遲的商品辨識體驗。消費者僅需透過 App 拍攝貨架商品,系統便能自動辨識品項、顯示資訊,並一鍵加入購物車完成支付。
為確保模型在複雜零售環境中的可靠性,我們投入嚴謹的數據工程與訓練流程。初始模型的平均精確度 (mAP@50) 約為 0.65;經由擴增資料集 (每類商品 50–100 張影像) 並優化標註策略後,最終 mAP@50 成功提升至 0.85,展現了模型在商品辨識與定位上的優異性能。
同時,我們已建構完整的後端架構,涵蓋 會員管理、商品分類、庫存追蹤與銷售紀錄,並設計數據分析頁面以支援決策。目前已成功以「飲料品項」完成概念驗證 (Proof of Concept),充分展現技術可行性。
展望未來,SwiftCart 具備高度擴展性,可進一步整合 個人化推薦系統、第三方支付串接,並應用於 無人商店、智慧貨架 等多元零售場景,逐步構建完整的數位零售生態圈。

關鍵字:YOLOv8, 物件偵測, 行動端 AI (On-Device AI / Edge AI)
 

113 data ml resultpost banner2

組員:陳○安、黃○忠、鄭○暄、吳○民、梁○銘、林○奇
摘要

本專案致力於開發一套智慧型股市預測系統,針對台灣加權股價指數(TAIEX)的短期走勢進行精準預測與投資資訊推播。系統以市場歷史價量資料(開盤價、最高價、最低價、收盤價、成交量)為基礎,衍生出多種技術指標(MA10、MA15、MACD、RSI),並結合創新的新聞量化特徵,提供兼具數據深度與市場情緒的綜合預測,最終輸出簡明的多空建議。系統架構分為三層:資料擷取層負責整合股市歷史交易數據與即時財經新聞;分析層為核心,透過 BERT 模型進行新聞語意解析,將市場情緒、產業動態、法人動向等文本資訊轉化為可量化的數值特徵,並結合價量與技術指標輸入 XGBoost 模型,完成最終的指數數值預測;應用層則利用 LINEBoT,每日定時推送預測結果、趨勢圖表及新聞摘要,協助投資人快速掌握市場脈動。
未來,系統將引入 LSTM 與 Transformer 等深度學習架構,以提升時間序列建模能力,並拓展至個股預測、ETF 策略建議與個人化投資組合分析,逐步打造全方位的智慧投資助理,實現 AI 在理財場景中的落地應用。

關鍵字:台灣加權股價指數、股價預測(XGBoost)、新聞分析(Bert)、LINE
 

113 data ml resultpost banner3

組員:吳○瑀、林○宏、吳○臻
摘要

本專案「智慧本壘板」旨在開發全自動化的棒球賽事記錄與可視化系統,以解決人工紀錄耗時且易出錯的問題。其核心在於將非結構化的棒球轉播文字描述,透過大型語言模型(LLM)解析並轉換為結構化數據。專案原規劃以客製化 NER 模型進行實體抽取,但需龐大標註資料而效率受限。最終改採 Few-Shot learning 策略,於 Prompt 中提供少量範例,引導 LLM 精準辨識棒球術語與事件實體。此方法免去繁瑣訓練流程,並較 Zero-Shot 更穩定,尤其在處理專業術語與複雜上下文上展現優勢,即使轉播描述含隱喻或省略語,也能正確解析。系統架構包含三大模組:其一,「語言轉換模組」自官方轉播紀錄擷取文本,經 LLM 解析後轉為事件代碼(EventCode)。其二,「規則判斷模組」透過邏輯引擎將事件代碼映射至賽局狀態,精準更新壘上跑者、好壞球與出局數,並確保不同轉播員風格差異下仍能維持一致邏輯。其三,「視覺化模組」將狀態即時呈現於前端,包括壘包狀態、比分板與燈號指示(黃=好球、綠=壞球、紅=出局),使比賽全貌清晰易懂。本專案展示 Few-Shot LLM 在專業文本解析的潛力,不僅簡化開發流程,更為結合即時語音轉播(ASR)、戰術分析與多語言擴展奠定基礎,展現 AI 技術於智慧化運動數據處理的突破價值。

關鍵字:LLM, Few-Shot Learning, 命名實體辨識 (NER),棒球, 棒球賽局狀態追蹤
 

113 data ml resultpost banner4

組員:洪○榛、許○筑、王○興
摘要

本專題旨在開發一套整合前端應用與後端核心技術的高保真度虛擬試衣(Virtual Try-On, VTO)平台,為時尚電商與個人化造型領域提供完整的端到端解決方案。在應用層面,使用者僅需上傳個人全身照片並選擇服飾,系統即可自動生成高度擬真的試穿圖像,並支援 PNG/SVG 格式下載與連結分享功能,以滿足商業行銷與社群互動等多元化需求。
技術核心採用創新的 IDM-VTON 方法,並整合 Stable Diffusion XL (SDXL) Inpainting 框架,旨在突破現有 VTO 技術普遍存在的「衣物細節失真」與「穿搭效果不自然」兩大挑戰。其關鍵為一套雙路徑語義萃取架構:首先,透過 IP-Adapter 提取服裝的高階語義特徵(如風格、剪裁與版型),並將其注入 UNet 的 cross-attention 層,以精準控制服裝的整體輪廓與穿搭感;其次,導入特製的 GarmentNet(一種平行 UNet 架構),專責捕捉布料紋理、圖案與光澤等低階細節,並將其特徵注入 self-attention 層,以確保圖像生成時的極致保真度。此設計能同時兼顧宏觀樣式與微觀細節,還能透過客製化微調與文字描述進一步強化對人像與服裝的語意控制,從而顯著提升生成圖像的真實感。
綜上所述,本專案不僅在演算法層面驗證了 IDM-VTON 的技術突破,更成功將其轉化為一個具備市場潛力的應用平台。它無縫串連了從使用者輸入、AI 生成到成果分享的完整流程,為時尚產業的數位轉型提供了兼具創新性與實用性的強大工具。

 關鍵字:虛擬試衣 (Virtual Try-On),IDM-VTON,Stable Diffusion Inpainting ,生成式 AI

113 data ml resultpost banner5

組員:李○淵、駱○山、陳○文
摘要

本專題聚焦於基於深度學習之聲音降噪技術,旨在突破傳統數位信號處理(DSP)演算法依賴預設噪聲模型的限制,針對真實環境中多樣化的非線性干擾(如背景環境音、回聲、非語音人聲)提供更具彈性的解決方案。核心方法採用語音加強生成對抗網路(Speech Enhancement Generative Adversarial Network, SEGAN)架構,藉由生成器將帶噪音訊頻譜映射至純淨頻譜,同時透過判別器學習分辨真實與生成結果,並在對抗式訓練過程中持續優化權重,以產出高度擬真的清晰語音。
研究中選用愛丁堡大學語音技術研究中心(CSTR)所提供的 Noisy speech database 作為訓練與驗證資料,涵蓋 11,572 組訓練樣本與 824 組測試樣本,確保模型能在多樣化情境下具備良好泛化能力。效能評估則採用三項公認的客觀指標:訊噪比(SNR)、語音品質感知評估(PESQ)以及短時客觀可懂度(STOI),全面衡量降噪後的語音品質與可理解度。
實驗結果顯示,SEGAN 不僅有效去除雜訊,同時能降低語音失真,展現深度生成模型在聲音處理領域的優勢。此技術具備廣泛應用潛力,可為智慧語音助理、助聽器、會議系統、自動語音辨識(ASR)等場景提供更佳的聽覺體驗,亦為未來人機互動及語音通訊技術的發展奠定基礎。

關鍵字:SEGAN (Speech Enhancement GAN), 對抗式訓練 (Adversarial Training), SNR、PESQ、STOI

 

FB album

 

Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它

Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它

 

AIoT 728X90