热门

Llama-3.1-Tulu-3-70B

1年前发布 11 00

Llama-3.1-Tulu-3-70B是Tülu3模型家族中的一员，专为现代后训练技术提供全面的指南。该模型不仅在聊天任务上表现出色，还在MATH、GSM8K和IFEval等多种任务上展现出了卓越的性能。作为一个开源模型，它允许研究人员和开发者访问和使用其数据和代码，以推动自然语言处理技术的发展。

收录时间：

2025-05-29

打开网站手机查看

文案写作 # 开源模型 # 文本生成 # 机器学习 # 自然语言处理

Llama-3.1-Tulu-3-70B

Llama-3.1-Tulu-3-70B

Llama-3.1-Tulu-3-70B是Tülu3模型家族中的一员，专为现代后训练技术提供全面的指南。该模型不仅在聊天任务上表现出色，还在MATH、GSM8K和IFEval等多种任务上展现出了卓越的性能。作为一个开源模型，它允许研究人员和开发者访问和使用其数据和代码，以推动自然语言处理技术的发展。

数据统计

相关导航

olmo-mix-1124

allenai/olmo-mix-1124数据集是由Hugging Face提供的一个大规模多模态预训练数据集，主要用于训练和优化自然语言处理模型。该数据集包含了大量的文本信息，覆盖了多种语言，并且可以用于各种文本生成任务。它的重要性在于提供了一个丰富的资源，使得研究人员和开发者能够训练出更加精准和高效的语言模型，进而推动自然语言处理技术的发展。

InternVL2_5-38B-MPO

InternVL2.5-MPO是一个先进的多模态大型语言模型系列，基于InternVL2.5和混合偏好优化（MPO）构建。该系列模型在多模态任务中表现出色，能够处理图像、文本和视频数据，并生成高质量的文本响应。模型采用'ViT-MLP-LLM'范式，通过像素unshuffle操作和动态分辨率策略优化视觉处理能力。此外，模型还引入了多图像和视频数据的支持，进一步扩展了其应用场景。InternVL2.5-MPO在多模态能力评估中超越了多个基准模型，证明了其在多模态领域的领先地位。

tulu-3-sft-olmo-2-mixture

allenai/tulu-3-sft-olmo-2-mixture是一个大规模的多语言数据集，包含了用于训练和微调语言模型的多样化文本样本。该数据集的重要性在于它为研究人员和开发者提供了丰富的语言资源，以改进和优化多语言AI模型的性能。产品背景信息包括其由多个来源的数据混合而成，适用于教育和研究领域，且遵循特定的许可协议。

EXAONE-3.5-7.8B-Instruct-AWQ

EXAONE 3.5是LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与最近发布的类似大小模型相比的一般领域中保持竞争力。EXAONE 3.5模型包括：1) 2.4B模型，优化用于小型或资源受限设备的部署；2) 7.8B模型，与前代模型大小相匹配，但提供改进的性能；3) 32B模型，提供强大的性能。

SmolLM2-1.7B

SmolLM2是一系列轻量级的语言模型，包含135M、360M和1.7B参数的版本。这些模型能够在保持轻量级的同时解决广泛的任务，特别适合在设备上运行。1.7B版本的模型在指令遵循、知识、推理和数学方面相较于前代SmolLM1-1.7B有显著进步。它使用包括FineWeb-Edu、DCLM、The Stack等多个数据集进行了训练，并且通过使用UltraFeedback进行了直接偏好优化（DPO）。该模型还支持文本重写、总结和功能调用等任务。

EXAONE-3.5-7.8B-Instruct

EXAONE-3.5-7.8B-Instruct是由LG AI Research开发的一系列指令调优的双语（英语和韩语）生成模型，参数范围从2.4B到32B。这些模型支持长达32K令牌的长上下文处理，并在真实世界用例和长上下文理解方面展现出最先进的性能，同时在与近期发布的类似大小模型相比，在通用领域保持竞争力。

INTELLECT-1-Instruct

INTELLECT-1-Instruct是一个由Prime Intellect训练的10亿参数语言模型，从零开始在1万亿个英文文本和代码token上进行训练。该模型支持文本生成，并且具有分布式训练的能力，能够在不可靠的、全球分布的工作者上进行高性能训练。它使用了DiLoCo算法进行训练，并利用自定义的int8 all-reduce内核来减少通信负载，显著降低了通信开销。这个模型的背景信息显示，它是由30个独立的社区贡献者提供计算支持，并在3个大洲的14个并发节点上进行训练。

Llama-3.1-Tulu-3-8B

Llama-3.1-Tulu-3-8B是Tülu3指令遵循模型家族的一部分，专为多样化任务设计，包括聊天、数学问题解答、GSM8K和IFEval等。这个模型家族以其卓越的性能和完全开源的数据、代码以及现代后训练技术的全面指南而著称。模型主要使用英文，并且是基于allenai/Llama-3.1-Tulu-3-8B-DPO模型微调而来。

暂无评论

您必须登录才能参与评论！

none

暂无评论...