热门

OminiControl

1年前发布 16 00

OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制（如边缘引导和图像修复生成）。OminiControl的设计非常精简，仅引入了基础模型0.1%的额外参数，同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发，代表了人工...

收录时间：

2025-05-30

打开网站手机查看

图像生成 # AI # Diffusion Transformer # f.lux # 图像生成 # 深度学习

OminiControl

OminiControl

OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制（如边缘引导和图像修复生成）。OminiControl的设计非常精简，仅引入了基础模型0.1%的额外参数，同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发，代表了人工智能领域中图像生成和控制技术的最新进展。

数据统计

相关导航

ComfyUI-IF_MemoAvatar

ComfyUI-IF_MemoAvatar是一个基于记忆引导扩散的模型，用于生成表达性的视频。该技术允许用户从单一图像和音频输入创建富有表现力的说话头像视频。这项技术的重要性在于其能够将静态图像转化为动态视频，同时保留图像中人物的面部特征和情感表达，为视频内容创作提供了新的可能性。该模型由Longtao Zheng等人开发，并在arXiv上发布相关论文。

Qwen2vl-Flux

Qwen2vl-Flux是一个结合了Qwen2VL视觉语言理解能力的FLUX框架的先进多模态图像生成模型。该模型擅长基于文本提示和视觉参考生成高质量图像，提供卓越的多模态理解和控制。产品背景信息显示，Qwen2vl-Flux集成了Qwen2VL的视觉语言能力，增强了FLUX的图像生成精度和上下文感知能力。其主要优点包括增强的视觉语言理解、多种生成模式、结构控制、灵活的注意力机制和高分辨率输出。

稳定扩散

稳定扩散是一个深度学习，文本到图像的模型，于2022年发布。主要用于生成基于文本描述的详细图像，但也可以应用于其他任务，如修复、超出原始边界以及生成由文本提示引导的图像到图像翻译。

Polarr Next AI Color Match

Polarr Next AI Color Match 是一款基于人工智能技术的在线色彩匹配工具，能够快速从任何图片中提取色彩风格，并将其应用到用户自己的照片上。该技术利用先进的AI算法，精准识别和匹配色彩，为用户提供高效、便捷的图像编辑体验。它不仅简化了复杂的色彩调整过程，还让用户能够轻松复制和应用各种图像的色彩风格，无论是专业摄影师还是普通爱好者，都能通过这款工具提升图像的视觉效果。产品目前主要通过网站提供服务，用户可以免费试用其基本功能，而更高级的功能可能需要付费解锁。其定位是为用户提供一种简单易用且高效的色彩匹配解决方案，满足不同场景下的图像编辑需求。

Depositphotos AI image generator

Depositphotos AI图像生成器是一款强大的工具，通过文本即可生成高质量图像，用户只需描述想要的图片，系统即可自动生成。具有商业许可，适合设计师、营销人员等多领域使用。

VisualCloze

VisualCloze 是一个通过视觉上下文学习的通用图像生成框架，旨在解决传统任务特定模型在多样化需求下的低效率问题。该框架不仅支持多种内部任务，还能泛化到未见过的任务，通过可视化示例帮助模型理解任务。这种方法利用了先进的图像填充模型的强生成先验，为图像生成提供了强有力的支持。

MangaNinja

MangaNinja 是一种参考引导的线稿上色方法，它通过独特的设计确保精确的人物细节转录，包括用于促进参考彩色图像和目标线稿之间对应学习的块洗牌模块，以及用于实现细粒度颜色匹配的点驱动控制方案。该模型在自收集的基准测试中表现出色，超越了当前解决方案的精确上色能力。此外，其交互式点控制在处理复杂情况（如极端姿势和阴影）、跨角色上色、多参考协调等方面展现出巨大潜力，这些是现有算法难以实现的。MangaNinja 由来自香港大学、香港科技大学、通义实验室和蚂蚁集团的研究人员共同开发，相关论文已发表在 arXiv 上，代码也已开源。

HunyuanVideo-I2V

HunyuanVideo-I2V 是腾讯开源的图像到视频生成模型，基于 HunyuanVideo 架构开发。该模型通过图像潜在拼接技术，将参考图像信息有效整合到视频生成过程中，支持高分辨率视频生成，并提供可定制的 LoRA 效果训练功能。该技术在视频创作领域具有重要意义，能够帮助创作者快速生成高质量的视频内容，提升创作效率。

暂无评论

您必须登录才能参与评论！

none

暂无评论...