PCM

1年前发布 13 00

Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和S...

收录时间:
2025-05-30

Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。

一丢导航 - 上一丢,不易丢

数据统计

相关导航

VideoTetris

VideoTetris

VideoTetris是一个新颖的框架,它实现了文本到视频的生成,特别适用于处理包含多个对象或对象数量动态变化的复杂视频生成场景。该框架通过空间时间组合扩散技术,精确地遵循复杂的文本语义,并通过操作和组合去噪网络的空间和时间注意力图来实现。此外,它还引入了一种新的参考帧注意力机制,以提高自回归视频生成的一致性。VideoTetris在组合文本到视频生成方面取得了令人印象深刻的定性和定量结果。
千面数字人

千面数字人

千面数字人是一款AI数字人视频生成工具,千面数字人Avatar系列的两款产品均依托先进 AI 技术,为用户带来创意内容生成新体验。音频转换产品能将静态图片与音频融合,让图片中的人物随声音动起来唱歌、说话,实现从静到动的趣味转化;模仿动作产品则可将 5 秒内的真人动作视频与动漫人物图片结合,使动漫角色精准复刻真人动作,赋予虚拟形象真实动态。两者操作简便,能满足二次元创作、游戏互动、社交娱乐等多元场景需求,助力用户轻松释放创意。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...