Stable Diffusion 3.5 MediumStable Diffusion 3.5 Medium是一个基于文本到图像的生成模型,由Stability AI开发,具有改进的图像质量、排版、复杂提示理解和资源效率。该模型使用了三个固定的预训练文本编码器,通过QK-规范化提高训练稳定性,并在前12个变换层中引入双注意力块。它在多分辨率图像生成、一致性和各种文本到图像任务的适应性方面表现出色。
SeeDream 4Seedream4是一款拥有革命性多模态AI技术的图像生成器,结合文本到图像生成、精确图像编辑和批量创作于一体。其主要优点包括1.8秒快速生成速度、自然语言控制、完整的创意控制和企业集成可用性。价格信息请访问官方网站。
FLUX.1-dev LoRA Outfit GeneratorFLUX.1-dev LoRA Outfit Generator是一个文本到图像的AI模型,能够根据用户详细描述的颜色、图案、合身度、风格、材质和类型来生成服装。该模型使用了H&M Fashion Captions Dataset数据集进行训练,并基于Ostris的AI Toolkit进行开发。它的重要性在于能够辅助设计师快速实现设计想法,加速服装行业的创新和生产流程。
Bylo.aiBylo.ai是一款高级的AI图像生成器,能够将文本描述快速转换为高质量的图像。它支持负面提示和多种模型,包括流行的Flux AI图像生成器,让用户可以自定义创作。Bylo.ai以其免费在线访问、快速高效生成、高级自定义选项、灵活的图像设置和高质量图像输出等特点,成为个人和商业用途的理想选择。
Sana_1600M_512pxSana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度、强大的文本图像对齐能力以及可在笔记本电脑GPU上部署的特性而著称。该模型基于线性扩散变换器,使用预训练的文本编码器和空间压缩的潜在特征编码器,代表了文本到图像生成技术的最新进展。Sana的主要优点包括高分辨率图像生成、快速合成、笔记本电脑GPU上的可部署性,以及开源的代码,使其在研究和实际应用中具有重要价值。
Regional-Prompting-FLUXRegional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型,它能够在无需训练的情况下,为扩散变换器(如FLUX)提供细粒度的组合文本到图像生成能力。该模型不仅效果显著,而且与LoRA和ControlNet高度兼容,能够在保持高速度的同时减少GPU内存的使用。
AWPortraitCNAWPortraitCN是一个基于FLUX.1-dev开发的文本到图像生成模型,专门针对中国人的外貌和审美进行训练。它包含多种类型的肖像,如室内外肖像、时尚和摄影棚照片,具有强大的泛化能力。与原始版本相比,AWPortraitCN在皮肤质感上更加细腻和真实。为了追求更真实的原始图像效果,可以与AWPortraitSR工作流程一起使用。
Sana_600M_1024pxSana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度和强大的文本图像对齐能力,使得在笔记本电脑GPU上也能部署。它是一个基于线性扩散变换器(text-to-image generative model)的模型,拥有1648M参数,专门用于生成1024px基础的多尺度高宽图像。Sana模型的主要优点包括高分辨率图像生成、快速的合成速度以及强大的文本图像对齐能力。Sana模型的背景信息显示,它是基于开源代码开发的,可以在GitHub上找到源代码,同时它也遵循特定的许可证(CC BY-NC-SA 4.0 License)。