热门

SV4D

1年前发布 10 00

Stable Video 4D (SV4D) 是基于 Stable Video Diffusion (SVD) 和 Stable Video 3D (SV3D) 的生成模型，它接受单一视角的视频并生成该对象的多个新视角视频（4D 图像矩阵）。该模型训练生成 40 帧（5 个视频帧 x 8 个摄像机视角）在 576x576 分辨率下，给定 ...

收录时间：

2025-05-29

打开网站手机查看

艺术创作 # 多视角视频 # 教育工具。# 生成模型 # 艺术创作 # 视频生成

SV4D

SV4D

Stable Video 4D (SV4D) 是基于 Stable Video Diffusion (SVD) 和 Stable Video 3D (SV3D) 的生成模型，它接受单一视角的视频并生成该对象的多个新视角视频（4D 图像矩阵）。该模型训练生成 40 帧（5 个视频帧 x 8 个摄像机视角）在 576×576 分辨率下，给定 5 个相同大小的参考帧。通过运行 SV3D 生成轨道视频，然后使用轨道视频作为 SV4D 的参考视图，并输入视频作为参考帧，进行 4D 采样。该模型还通过使用生成的第一帧作为锚点，然后密集采样（插值）剩余帧来生成更长的新视角视频。

数据统计

相关导航

大设

大设是基于 Stable Diffusion 的免费 AI 绘画网站，提供一键生成高清精绘大图、SDXL 模型教程、AI 提示词工具。背景包括清华大学研发，定位为 AI 智能绘画平台。

混元-DiT

混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型，专注于中文元素理解，具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息，并生成相应的艺术作品，包括但不限于人物写真、创意创作等。混元-DiT的推出，对于提升中文文本理解的深度和广度，以及促进中英双语交流具有重要意义。

MagicColor

MagicColor 是一个创新的多实例草图上色框架，旨在自动化传统的手动上色流程。传统的上色方法费时且容易出错，而 MagicColor 通过引入自我训练策略、实例引导器和边缘损失等技术设计，显著提升了上色效率和准确性。该产品能够在保持多个对象一致性的同时，自动将草图转化为生动的彩色图像。此技术不仅简化了艺术创作的流程，也为需要一致性和精确度的多实例图像生成提供了有效的解决方案，适用于动漫、游戏等多个领域。

Worlds of Frames

Frames 是 Runway 的核心产品之一，专注于图像生成领域。它通过深度学习技术，为用户提供高度风格化的图像生成能力。该模型允许用户定义独特的艺术视角，生成具有高度视觉保真度的图像。其主要优点包括强大的风格控制能力、高质量的图像输出以及灵活的创作空间。Frames 面向创意专业人士、艺术家和设计师，旨在帮助他们快速实现创意构思，提升创作效率。Runway 提供了多种使用场景和工具支持，用户可以根据需求选择不同的功能模块。价格方面，Runway 提供了付费和免费试用的选项，以满足不同用户的需求。

2D to 3D Image Converter

Stylar AI的2D to 3D Image Converter是一个强大的图像转换工具，它利用先进的Image-to-Image技术，将平面2D图像转换为3D图像。这款工具提供高质量的图像转换和多种风格选项，能够满足用户对图像进行3D化的需求。产品的主要功能包括上传图片、选择3D效果、下载3D创作等。它还提供了多种3D风格，如3D卡通效果、3D艺术作品等，以及将草图转换为3D设计的功能。

FLUX.1-dev-LoRA-Text-Poster

FLUX.1-dev-LoRA-Text-Poster是由Shakker-Labs开发的文本到图像生成模型，专门用于艺术文本海报的生成。该模型利用LoRA技术，通过文本提示来生成图像，为用户提供了一种创新的方式来创作艺术作品。模型的训练由版权用户cooooool完成，并在Hugging Face平台上共享，以促进社区的交流和发展。模型遵循非商业用途的flux-1-dev许可协议。

Stable Video Diffusion 1.1 Image-to-Video

Stable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型，通过将静止图像作为条件帧，生成相应的视频。该模型是一个潜在扩散模型，经过训练，能够从图像生成短视频片段。在分辨率为 1024x576 的情况下，该模型训练生成 25 帧视频，其训练基于相同大小的上下文帧，并从 SVD Image-to-Video [25 frames] 进行了微调。微调时，固定了6FPS和Motion Bucket Id 127的条件，以提高输出的一致性，而无需调整超参数。

Image Recursor

Image Recursor是一个基于 DALL-E 3 和 GPT-4 Vision 的图像生成工具。它通过输入一个起始图像和一些参数，可以生成一系列经过修改的图像。用户可以自定义生成的图像风格，例如恐怖、随机、神秘、强烈、有趣等。图像递归生成器可以用于创造艺术作品、设计概念图、玩具设计等多种场景。

暂无评论

您必须登录才能参与评论！

none

暂无评论...