热门

EXAONE-3.5-7.8B-Instruct-AWQ

1年前发布 19 00

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于...

收录时间：

2025-05-30

打开网站手机查看

文案写作 # 4位精度 # awq # exaone # lg-ai # Safetensors # Transformers # 文本生成 # 汉语 # 英语

EXAONE-3.5-7.8B-Instruct-AWQ

EXAONE-3.5-7.8B-Instruct-AWQ

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于小型或资源受限设备的部署；2) 7.8B模型，与前代模型大小相匹配，但提供改进的性能；3) 32B模型，提供强大的性能。

数据统计

相关导航

AI ContentCraft

AI ContentCraft 是一个强大的内容创作平台，旨在帮助创作者快速生成故事、播客脚本和多媒体内容。它通过集成文本生成、语音合成和图像生成技术，为创作者提供一站式的解决方案。该工具支持中英文内容转换，适合需要高效创作的用户。其技术栈包括 DeepSeek AI、Kokoro TTS 和 Replicate API，确保高质量的内容生成。产品目前开源免费，适合个人和团队使用。

SmolLM2-1.7B

SmolLM2是一系列轻量级的语言模型，包含135M、360M和1.7B参数的版本。这些模型能够在保持轻量级的同时解决广泛的任务，特别适合在设备上运行。1.7B版本的模型在指令遵循、知识、推理和数学方面相较于前代SmolLM1-1.7B有显著进步。它使用包括FineWeb-Edu、DCLM、The Stack等多个数据集进行了训练，并且通过使用UltraFeedback进行了直接偏好优化（DPO）。该模型还支持文本重写、总结和功能调用等任务。

OLMo-2-1124-13B-SFT

OLMo-2-1124-13B-SFT是由Allen AI研究所开发的一个大型语言模型，经过在特定数据集上的监督微调，旨在提高在多种任务上的表现，包括聊天、数学问题解答、文本生成等。该模型基于Transformers库和PyTorch框架，支持英文，拥有Apache 2.0的开源许可证，适用于研究和教育用途。

OLMo-2-1124-7B-RM

OLMo-2-1124-7B-RM是由Hugging Face和Allen AI共同开发的一个大型语言模型，专注于文本生成和分类任务。该模型基于7B参数的规模构建，旨在处理多样化的语言任务，包括聊天、数学问题解答、文本分类等。它是基于Tülu 3数据集和偏好数据集训练的奖励模型，用于初始化RLVR训练中的价值模型。OLMo系列模型的发布，旨在推动语言模型的科学研究，通过开放代码、检查点、日志和相关的训练细节，促进了模型的透明度和可访问性。

Aya Expanse 32B

Aya Expanse 32B是由Cohere For AI开发的多语言大型语言模型，拥有32亿参数，专注于提供高性能的多语言支持。它结合了先进的数据仲裁、多语言偏好训练、安全调整和模型合并技术，以支持23种语言，包括阿拉伯语、中文（简体和繁体）、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。该模型的发布旨在使社区基础的研究工作更加易于获取，通过发布高性能的多语言模型权重，供全球研究人员使用。

o1-pro

o1-pro 模型是一种先进的人工智能语言模型，专为提供高质量文本生成和复杂推理设计。其在推理和响应准确性上表现优越，适合需要高精度文本处理的应用场景。该模型的定价基于使用的 tokens，输入每百万 tokens 价格为 150 美元，输出每百万 tokens 价格为 600 美元，适合企业和开发者在其应用中集成高效的文本生成能力。

InternVL2_5-4B

InternVL2_5-4B是一个先进的多模态大型语言模型（MLLM），在InternVL 2.0的基础上进行了核心模型架构的维护，并在训练和测试策略以及数据质量上进行了显著增强。该模型在处理图像、文本到文本的任务中表现出色，特别是在多模态推理、数学问题解决、OCR、图表和文档理解等方面。作为开源模型，它为研究人员和开发者提供了强大的工具，以探索和构建基于视觉和语言的智能应用。

Llama-3.1-70B-Instruct-AWQ-INT4

Llama-3.1-70B-Instruct-AWQ-INT4是一个由Hugging Face托管的大型语言模型，专注于文本生成任务。该模型拥有70B个参数，能够理解和生成自然语言文本，适用于多种文本相关的应用场景，如内容创作、自动回复等。它基于深度学习技术，通过大量的数据训练，能够捕捉语言的复杂性和多样性。模型的主要优点包括高参数量带来的强大表达能力，以及针对特定任务的优化，使其在文本生成领域具有较高的效率和准确性。

暂无评论

您必须登录才能参与评论！

none

暂无评论...