又黄又爽的成人免费视频播放,欧美视频在线播放观看免费福利资源,国产成人亚洲精品久久

C114
通信人家園
English
公眾號矩陣

投稿
舉報

量子大觀

通信人家園

C114通信網

光通信觀察

DVBCN中廣5G

2025/6/24 09:03

蘋果另辟蹊徑：利用“歸一化流”技術打造 AI 生圖模型

IT之家漾仔

業界通常使用擴散模型或自回歸模型來研發 AI 生圖模型，蘋果公司近期發布的論文顯示該公司正在選擇一條被“遺忘”的歸一化流（Normalizing Flows）技術路線研發相應模型。

據介紹，這一“歸一化流”技術是一種通過學習數學變換的方式，將真實世界的數據（如圖像）轉換成結構化噪聲，并再將噪聲還原為圖像樣本的生成模型。其最大優勢是能夠精確計算生成圖像的概率，這是擴散模型無法做到的。這一特性使得歸一化流在對概率要求較高的任務中具有獨特吸引力。不過此類模型并不常見，原因在于其研發成本更高，同時早期采用相應技術生成的模型往往相對模糊、缺乏細節。

參考蘋果公司《Normalizing Flows are Capable Generative Models》論文，其推出一種名為 TarFlow（Transformer AutoRegressive Flow）的新型歸一化流技術模型，該模型的核心思路是將一張待生成的大圖拆成“小區塊”，再以相應區塊為單位進行生成一系列像素值，每一塊圖像像素值的生成都依賴于前面已生成的部分，繼而形成完整的圖像，因此能夠有效避免圖像被壓縮為固定詞匯表時產生的質量損失與表現僵化的問題。

當然，TarFlow 在生成高分辨率圖像方面仍存在局限，這就引出了第二篇研究《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

參考這篇論文，蘋果在 TarFlow 的基礎上進一步提出了增強版本：STARFlow（Scalable Transformer AutoRegressive Flow）。

該模型最大的改進在于，它不再直接在像素層面生成圖像，而是在“潛空間”（latent space）中工作，首先生成圖像的壓縮表示，再通過解碼器進行放大還原。因此模型可無須再預測數百萬個像素值，而是先處理圖像的大體結構，細節部分留給解碼器進行補充，從而在不損失質量的前提下提升生成效率。

此外，STARFlow 還改進了對文本提示的處理方式。它不再內建專用文本編碼器，而是支持調用現有語言模型（例如谷歌推出的小語言模型 Gemma，理論上可以直接在設備上運行）來處理用戶的語言指令。這樣一來，模型的圖像生成部分可以專注于圖像細節的生成與優化。

免責聲明：本文僅代表作者個人觀點，與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關內容。

給作者點贊

0 VS 0

寫得不太好

相關鏈接

蘋果 AI

消息稱臺積電為蘋果建 2 納米專用產線：iPhone 18 Pro 系列 A20 芯片擬采用 WMCM 封裝技術
IT之家遠洋09:01
蘋果發布iOS 26 Beta 2：控制中心BUG修復降低透明度
快科技建嘉08:40
45秒AI轉錄34分鐘4K視頻：蘋果Speech技術力壓群雄，比OpenAI Whisper快55%
IT之家故淵6-18
2025 年蘋果 Mac 安全報告：信息竊取惡意軟件激增 28%，成為頭號威脅
IT之家遠洋6-18

特別策劃

日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看