热门

Stable Video Diffusion 1.1 Image-to-Video

1年前发布 17 00

Stable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型，通过将静止图像作为条件帧，生成相应的视频。该模型是一个潜在扩散模型，经过训练，能够从图像生成短视频片段。在分辨率为 1024x576 的情况下，该模型训练生成 25 帧视频，其训练基于相同大小的上下文帧，并从 SVD Image...

收录时间：

2025-05-29

打开网站手机查看

艺术创作 # 图像到视频 # 教育 # 潜在扩散模型 # 生成模型 # 研究 # 艺术创作

Stable Video Diffusion 1.1 Image-to-Video

Stable Video Diffusion 1.1 Image-to-Video

Stable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型，通过将静止图像作为条件帧，生成相应的视频。该模型是一个潜在扩散模型，经过训练，能够从图像生成短视频片段。在分辨率为 1024×576 的情况下，该模型训练生成 25 帧视频，其训练基于相同大小的上下文帧，并从 SVD Image-to-Video [25 frames] 进行了微调。微调时，固定了6FPS和Motion Bucket Id 127的条件，以提高输出的一致性，而无需调整超参数。

数据统计

相关导航

Worlds of Frames

Frames 是 Runway 的核心产品之一，专注于图像生成领域。它通过深度学习技术，为用户提供高度风格化的图像生成能力。该模型允许用户定义独特的艺术视角，生成具有高度视觉保真度的图像。其主要优点包括强大的风格控制能力、高质量的图像输出以及灵活的创作空间。Frames 面向创意专业人士、艺术家和设计师，旨在帮助他们快速实现创意构思，提升创作效率。Runway 提供了多种使用场景和工具支持，用户可以根据需求选择不同的功能模块。价格方面，Runway 提供了付费和免费试用的选项，以满足不同用户的需求。

Image Recursor

Image Recursor是一个基于 DALL-E 3 和 GPT-4 Vision 的图像生成工具。它通过输入一个起始图像和一些参数，可以生成一系列经过修改的图像。用户可以自定义生成的图像风格，例如恐怖、随机、神秘、强烈、有趣等。图像递归生成器可以用于创造艺术作品、设计概念图、玩具设计等多种场景。

Artedge AI

Artedge AI是一个提供前沿AI工具的平台，旨在提升用户的创意过程。平台提供AI艺术生成器和AI亲吻生成器等工具，以快速生成高分辨率、高质量的艺术作品。这些工具不仅能够加速创意实现，还能提供独特的艺术体验，适合设计师、艺术家和创意爱好者。平台还提供定价计划，用户可以根据自己的需求选择合适的服务。

deforum-x-flux

Deforum-x-flux是一个基于flux-dev的Deforum实现，由XLabs-AI开发。它是一个开源的图像生成模型，能够通过文本提示生成高度逼真的图像。该模型利用了最新的人工智能技术，具有生成高质量图像的能力，并且可以应用于多种场景，如艺术创作、游戏设计等。

IC-Light V2-Vary

IC-Light V2-Vary是一款基于扩散模型的光照编辑工具，主要针对复杂光照场景中的图像生成和编辑问题，提供了光照一致性约束、大规模数据支持、精确光照编辑等功能。它通过物理光传输理论确保物体在不同光照条件下的表现可以线性组合，减少图像伪影，保持输出结果与实际物理光照条件一致。适用于摄影师、设计师及3D建模专业人士，同时为艺术创作者提供了更多可能性。

大设

大设是基于 Stable Diffusion 的免费 AI 绘画网站，提供一键生成高清精绘大图、SDXL 模型教程、AI 提示词工具。背景包括清华大学研发，定位为 AI 智能绘画平台。

AI Photo Editor & Art Creation

AI Photo Editor是一款由AI技术支持的高级照片编辑应用，提供无缝直观的体验，适合初学者和专业人士。它是一个一站式设计工作室，可以去除照片中不需要的物体，增强图像质量，应用惊人的滤镜，甚至将照片转换成动漫风格的肖像，所有这些都通过AI精确实现。无论你是出于娱乐目的编辑照片，还是追求专业质量的结果，这款应用都让这个过程变得简单且免费。

SV4D

Stable Video 4D (SV4D) 是基于 Stable Video Diffusion (SVD) 和 Stable Video 3D (SV3D) 的生成模型，它接受单一视角的视频并生成该对象的多个新视角视频（4D 图像矩阵）。该模型训练生成 40 帧（5 个视频帧 x 8 个摄像机视角）在 576x576 分辨率下，给定 5 个相同大小的参考帧。通过运行 SV3D 生成轨道视频，然后使用轨道视频作为 SV4D 的参考视图，并输入视频作为参考帧，进行 4D 采样。该模型还通过使用生成的第一帧作为锚点，然后密集采样（插值）剩余帧来生成更长的新视角视频。

暂无评论

您必须登录才能参与评论！

none

暂无评论...