作者 error405 (流河=L)標題 [閒聊] 實時AI老婆 Qwen3.5 ..本週AI新聞時間 Sun Mar 1 12:00:03 2026
https://www.youtube.com/watch?v=8grIT-xK50M
https://i.meee.com.tw/tHZT5uD.png
這段影片由 YouTube 頻道 AI Search 發佈,彙整了本週重大的 AI 技術進展與工具更新
。以下是根據影片資訊欄時間軸整理的新聞簡介:
[0:00] AI 新聞引言:概述本週 AI 界的瘋狂進展,包含物理精確的影像編輯器、虛
擬伴侶、向量圖形生成以及阿里巴巴新發佈的 Qwen 3.5 模型。
[1:03] VBVR (Very Big Video Reasoning):這是一個建立在影片生成模型 Wan
2.1 之上的框架,讓 AI 具備「推理」能力。它可以根據指令在影片中解決視覺謎題,例
如圈出特定字元或模擬物理平衡,表現優於 Sora 等模型。
[4:09] tttLRM:一種 3D 重建技術,透過多張照片生成高度逼真且細節豐富的 3D
模型,比傳統的 3DGS 方法更清晰、一致性更高。
[6:37] DreamID Omni:字節跳動(ByteDance)開發的影片生成器,可同時輸入文本
、圖像和人物聲音,精準生成具有特定聲音與外貌的深偽(Deepfake)影片或進行編輯。
[9:40] Quiver Arrow (Aero 1):目前生成 SVG 向量圖形最強的 AI 模型,能生成
可無限放大而不失真的數學路徑圖案,專精於標誌與圖示設計。
[12:22] Solaris:專門生成 Minecraft 遊戲畫面的 AI,特別之處在於它能同時生
成「兩名玩家」在同一場景下的不同視角畫面,並保持時空一致性。
[15:25] VideoMT:一種輕量級的影片分割(Segmentation)模型,能以極快的速度
(高達 160 FPS)追蹤並標定影片中的多個物體(如移動中的斑馬)。
[17:11] VecGlypher:幫助使用者透過文字描述或參考圖片,直接生成整套向量字體
與字形結構(Glyphs)。
[19:26] Unitree Go2 (宇樹科技):展示了新款機器狗在崎嶇地形的高速奔跑能力,
以及承受超過自身重量六倍(105公斤)的負載能力。
[20:39] Agibot G2 (智元機器人):輪式工業級人型機器人,具備高度靈活的手部,
能進行亞毫米級精度的電子元件組裝,並支援熱插拔電池 24/7 運作。
[21:53] Gamma:AI 簡報與網頁製作工具,現在已整合進 Claude AI 介面中,可直
接從對話生成設計美觀的投影片。
[23:59] LavaSR:超輕量音訊增強器,體積僅 50MB,能在 GPU 上以 5000 倍實時速
度運行,甚至能在手機上流暢運作,去除背景雜訊並提升人聲品質。
[26:05] Qwen 3.5:阿里巴巴發佈的新一代開源模型。除了最強大的版本外,還推出
了 2B、35B、27B 等不同規模的版本,讓家用電腦也能執行具備頂尖智慧的 AI。
[27:40] EgoScale:Nvidia 的機器人學習系統,讓機器人只需觀看人類操作的影片
(如摺衣服、用螺絲起子),就能學會複雜的動作任務。
[29:46] Doc to Lora:Sakana AI 的新技術,將長篇文件或複雜指令「壓縮」成一
個輕量化的 LoRA 模型,讓 AI 擁有長久且高效的特定知識記憶,無需重複複製貼上文件
。
[33:06] PhysicEdit:物理精確的影像編輯器,能準確模擬現實物理現象,如杯中吸
管的折射、香蕉腐爛或泥土變硬的視覺效果。
[35:21] Generated Reality:根據使用者的頭部與手部動作實時生成互動式第一人
稱影片,是未來虛擬實境(VR)結合 AI 的雛形。
[36:24] MMHNet (Sony):Sony 發佈的 AI,能為長達 5 分鐘的影片自動生成並同步
音效,表現比以往的模型更具節奏感與一致性。
[39:17] Sarah:VR 中的實時全身 AI 虛擬伴侶,能感知使用者的位置並進行自然眼
神接觸與肢體動作交流。
[42:03] LorWeb:Nvidia 推出的獨特影像編輯器,使用者提供「修改前/後」的範例
圖片與欲修改的目標圖片,AI 就能精準複製特定風格到新圖上。
[44:20] Nvidia GPU 抽獎:創作者與 Nvidia 合作,只要報名參加 GTC 2026 活動
,就有機會獲得 RTX 5090 顯卡。
--
Gemini3整理
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.246.126 (臺灣)
※ 作者: error405 2026-03-01 12:00:03
※ 文章代碼(AID): #1fexd541 (AI_Art)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1772337605.A.101.html
→ error405: *Qwen目前沒有2B版 這應該是筆誤1F 03/01 12:20
推 ct13579: 那些開源模型真能對標頂尖閉源模型?2F 03/01 12:52
→ error405: 畢竟是開幾萬帳號去跟人家偷師的3F 03/01 13:03
推 rex7788: 很多模型門檻都太高,阿里巴巴的輕量化方向才是正確的4F 03/01 14:20
推 newyorker54: 用了幾個開源模型真的很強
輕量化解決問題的能力還是有差5F 03/01 15:24
推 YCL13: 那個是Qwen3.5 122B的口誤讓生成字幕出錯了7F 03/01 17:26
→ error405: 看日本那在用qwen破限版35B寫黃文8F 03/01 19:24
推 YCL13: 覺得Qwen3.5比Qwen3好的地方是模型全能多了,Qwen3各式模型我下載了一堆,目前看Qwen3.5推出的模型就沒分那麼多種,就算思考也是下參數關掉就好9F 03/01 19:40
--