热门

MangaNinja

1年前发布 16 00

MangaNinja 是一种参考引导的线稿上色方法，它通过独特的设计确保精确的人物细节转录，包括用于促进参考彩色图像和目标线稿之间对应学习的块洗牌模块，以及用于实现细粒度颜色匹配的点驱动控制方案。该模型在自收集的基准测试中表现出色，超越了当前解决方案的精确上色能力。此外，其交互式点控制在处理复杂情况（如极端姿势和阴影）、跨角色上色、多参考...

收录时间：

2025-05-29

打开网站手机查看

图像生成 # 人工智能 # 图像处理 # 深度学习 # 漫画创作 # 线稿上色

MangaNinja

MangaNinja

MangaNinja 是一种参考引导的线稿上色方法，它通过独特的设计确保精确的人物细节转录，包括用于促进参考彩色图像和目标线稿之间对应学习的块洗牌模块，以及用于实现细粒度颜色匹配的点驱动控制方案。该模型在自收集的基准测试中表现出色，超越了当前解决方案的精确上色能力。此外，其交互式点控制在处理复杂情况（如极端姿势和阴影）、跨角色上色、多参考协调等方面展现出巨大潜力，这些是现有算法难以实现的。MangaNinja 由来自香港大学、香港科技大学、通义实验室和蚂蚁集团的研究人员共同开发，相关论文已发表在 arXiv 上，代码也已开源。

数据统计

相关导航

EasyControl

EasyControl 是一个为 Diffusion Transformer（扩散变换器）提供高效灵活控制的框架，旨在解决当前 DiT 生态系统中存在的效率瓶颈和模型适应性不足等问题。其主要优点包括：支持多种条件组合、提高生成灵活性和推理效率。该产品是基于最新研究成果开发的，适合在图像生成、风格转换等领域使用。

HiPixel

HiPixel 是一款原生 macOS 应用程序，专为图像超分辨率处理而设计。它利用 Upscayl 的 AI 模型，提供高质量图像放大功能，且通过 GPU 加速实现快速处理，适合需要图像处理的设计师和摄影师。该产品在 macOS 平台上运行流畅，支持多种图像格式，并提供便捷的文件夹监控功能。HiPixel 的定位为高效的图像处理工具，旨在提高用户的工作效率。

ComfyUI_AdvancedRefluxControl

ComfyUI_AdvancedRefluxControl是一个自定义节点工具，用于控制Redux模型中条件图像对最终图像的影响强度。Redux模型通常用于生成图像的多个变体，但不支持根据提示改变图像。此工具通过添加自定义节点，允许用户调整Redux效果的强度，支持非方形图像和带遮罩的条件图像，从而增强图像生成的灵活性和控制力。

nanobananafree

Nano Banana AI是一款强大的人工智能图像生成器，利用先进的AI技术轻松生成高质量图像。它为用户提供定制化的个性化图像生成服务，可用于各种创意项目和需求。

TRELLIS 3D AI

TRELLIS 3D AI是一款利用人工智能技术将图片转换成3D资产的专业工具。它通过结合先进的神经网络和结构化潜在技术（Structured LATents, SLAT），能够保持输入图片的结构完整性和视觉细节，生成高质量的3D资产。产品背景信息显示，TRELLIS 3D AI被全球专业人士信赖，用于可靠的图像到3D资产的转换。与传统的3D建模工具不同，TRELLIS 3D AI提供了一个无需复杂操作的图像到3D资产的转换过程。产品价格为免费，适合需要快速、高效生成3D资产的用户。

StructLDM

StructLDM是一个结构化潜在扩散模型，用于从2D图像学习3D人体生成。它能够生成多样化的视角一致的人体，并支持不同级别的可控生成和编辑，如组合生成和局部服装编辑等。该模型在无需服装类型或掩码条件的情况下，实现了服装无关的生成和编辑。项目由南洋理工大学S-Lab的Tao Hu、Fangzhou Hong和Ziwei Liu提出，相关论文发表于ECCV 2024。

InternVL3

InternVL3是由OpenGVLab开源发布的多模态大型语言模型（MLLM），具备卓越的多模态感知和推理能力。该模型系列包含从1B到78B共7个尺寸，能够同时处理文字、图片、视频等多种信息，展现出卓越的整体性能。InternVL3在工业图像分析、3D视觉感知等领域表现出色，其整体文本性能甚至优于Qwen2.5系列。该模型的开源为多模态应用开发提供了强大的支持，有助于推动多模态技术在更多领域的应用。

Headpix.ai

Headpix是一款专业的AI头像生成器，可以将普通照片转化为高质量的个性化头像。快速生成多达100张头像供选择，适用于职业社交、模特招募和远程团队等场景。

暂无评论

您必须登录才能参与评论！

none

暂无评论...