文章一作?????奈寤笱昙恫┦可,,,研究偏向为深度天生模子,,,,曾提出流式扩散模子最大似然预计刷新手艺 i-DODE,,,,扩散模子高效采样器 DPM-Solver-v3,,,,扩散桥模子采样器 DBIM 以及掩码式离散扩散模子采样器 FHS 等。。。
清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉天生模子优化范式 —— 直接判别优化(DDO)。。。该要领将基于似然的天生模子(如扩散模子、自回归模子)隐式参数化为 GAN,,,,从而设计出一种无需特殊网络、训练高效的微调要领,,,,并大幅突破古板最大似然训练的性能瓶颈。。。
近年来,,,,扩散模子(Diffusion Models)和自回归模子(Autoregressive Models)在图像天生中占有主导职位,,,,如 NVIDIA 的 EDM 系列扩散模子和字节跳动以 VAR 为代表的视觉自回归模子。。。相比 GAN(Generative Adversarial Networks)这类直接优化数据天生历程的隐式天生模子,,,,扩散模子和自回归模子均属于基于似然的天生模子(Likelihood-Based Generative Model),,,,它们显式预计数据的对数似然(log-likelihood),,,,具有训练稳固、样本多样性强、容易规;;;;奶氐
然而,,,,这类模子普遍接纳的最大似然预计(Maximum Likelihood Estimation, MLE)逊ю失对应的是正向 KL 散度,,,,会导致「mode covering」问题:模子倾向于笼罩所有数据模式而非聚焦主要漫衍,,,,并且会在低估数据集中任何样本的似然时遭受严肃处分,,,,从而使天生效果模糊或失真,,,,在模子容量缺乏时限制了天生质量。。。例如,,,,i-DODE 作为专注于似然的模子,,,,虽然在密度预计使命上抵达了最先进水平,,,,但在 FID 等视觉质量指标下体现不佳。。。现有视觉天生模子也往往依赖指导(guidance)要领,,,,如无需分类器的指导(Classifier-Free Guidance, CFG),,,,来抑制低质量天生样本。。。
为解决 MLE 的局限性,,,,文章思量使用GAN 式判别的头脑,,,,在训练目的中引入反向 KL 散度的因素,,,,强化模子在真实数据周围的密度,,,,同时抑制过失区域,,,,将模子漫衍由图(a):强调密度笼罩,,,,微调为图(b):强调密度集中,,,,从而提高天生保真度与有限模子容量下的天生质量。。。然而,,,,直接使用 GAN 损失会引入特另外判别器网络与工程优化上的重大性,,,,尤其关于扩散/自回归模子这类需要迭代式多步天生的模子。。。
详细来说,,,,DDO 引入待微调的目的模子和一个冻结的参考模子(均初始化为预训练模子),,,,使用两个模子的对数似然比结构「隐式判别器」,,,,获得可直接应用于扩散模子和自回归模子的 GAN 式优化目的:
DDO 为扩散模子和自回归模子提供了即插即用的新训练目的,,,,其微调后的模子和原模子具有完全相同的网络结构和采样方法,,,,而在天生质量上大大增强
更主要的是,,,,DDO无需修改网络结构、不增添推理本钱,,,,且与主流 CFG 等指导要领兼容,,,,可叠加使用进一步提升性能。。。如在视觉自回归模子 VAR 上,,,,微调后的模子通过控制 CFG 的强度,,,,获得的FID-IS 曲线整体显著优于原模子
DDO 参数化的灵感来自于语言模子中的直接偏好优化(DPO, Direct Preference Optimization),,,,但其目的从「成对的偏好对齐」扩展到了「漫衍对齐」,,,,更为通用。。。DDO 虽然没有「奖励」的看法,,,,但其中使用自天生样本作为负例的头脑也与大语言模子中盛行的 RL 算法如 GRPO 具有相似性,,,,这允许模子从过失中反思学习。。。也就是说,,,,GRPO 中负例的作用同样可以诠释为使用 reverse KL 散度抑制 mode covering 趋势从而提升天生质量,,,,这在数学推理等使命中具有主要意义。。。该思绪有望扩展至多模态天生等使命,,,,构建统一的对齐范式
《泰剧《一夜轻欢》剧情介绍》此前对3D打印的理解,多半停留在“打印机喷出塑料堆成模型”的层面。这本书则指出,真正高端的3D打印玩的是金属,而第一步并非打印,而是先把金属变成粉末。我再次请求会员去投票。大家当然可以把票投给任何人,但我希望他们能够支持我们,也希望他们认真看看我们在会员事务上的提案。对我们来说,明天只有一个目标——赢。《泰剧《一夜轻欢》剧情介绍》快穿之活大器好的系统宋清欢TXT麦克格雷迪和Shams还提到了文班亚马此前在法国时的表现,他们表示,当文班亚马和他的法国球队来到拉斯维加斯与点燃队进行背靠背比赛时,那是大多数美国球迷和媒体第一次近距离看到他。Shams说道:“那是大多数美国人第一次在本土看到他,虽然之前有部分球探去欧洲看过他,但那次拉斯维加斯之行才是真正的首次大规模亮相。”在此基础上,他的团队选择了一条与主流“端到端强化学习”截然不同的技术路径:一套经典的生产级感知-规划-控制管线,辅以“一个博士生一个算法”的管理哲学,确保每个模块拥有完全的技术所有权和极致的工程深度。
20260607 ? 《泰剧《一夜轻欢》剧情介绍》北京时间6月5日,利物浦新帅伊劳拉接受了俱乐部官方的采访,他谈到了自己对安菲尔德印象,表示执教利物浦给了他执教顶级球员的机会,他直言自己清楚外界对他的期待,相信自己的风格与利物浦相契合。《夜班护士》大下场免费寓目电视剧经过六个月的化疗后,她询问后续方案,医生的回答斩钉截铁:“马上、赶紧生,生了就来切。”这意味着,她必须先怀孕生子,才能切除剩余的病灶,“斩草除根”。
20260607 ? 《泰剧《一夜轻欢》剧情介绍》布鲁诺-费尔南德斯已随葡萄牙队前往北美备战世界杯。不过在出征赛事前,他与曼联高层进行了沟通,并明确表示自己无意离队。《丈夫面妻子被装修工欺压电视剧免费》面向个人:推出本地AI助手QClaw(支持微信直连、打通腾讯文档/会议/ima/QQ邮箱)、个人知识智能体ima(支持专属Agent与记忆系统)、元宝及“元宝高考通”Agent。