热门

Qwen2.5-Coder-14B

1年前发布 13 00

Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型，覆盖了0.5到32亿参数的不同模型尺寸，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代...

收录时间：

2025-05-30

打开网站手机查看

代码辅助 # Transformers # 代码修复 # 代码推理 # 代码生成 # 编程辅助 # 长上下文支持

Qwen2.5-Coder-14B

Qwen2.5-Coder-14B

Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型，覆盖了0.5到32亿参数的不同模型尺寸，以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升，基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此外，它还为现实世界应用如代码代理提供了更全面的基础，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。

数据统计

相关导航

Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，该模型在训练中涵盖了5.5万亿的源代码、文本代码基础、合成数据等，成为当前开源代码语言模型的最新技术。该模型不仅在编程能力上与GPT-4o相匹配，还在数学和一般能力上保持了优势。Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int4模型是经过GPTQ量化的4位指令调整模型，具有因果语言模型、预训练和后训练、transformers架构等特点。

Qwen2.5-Coder-3B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，训练令牌扩展到5.5万亿，包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型，其编码能力与GPT-4o相匹配。该模型在实际应用中提供了更全面的基础，如代码代理，不仅增强了编码能力，还保持了在数学和通用能力方面的优势。

Qwen2.5-Coder Technical Report

Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型，包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练，并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合，展现出令人印象深刻的代码生成能力，同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能，并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界，而且通过其许可授权，鼓励开发者在现实世界的应用中更广泛地采用。

Qwen2.5-Coder-0.5B-Instruct-AWQ

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力，通过扩展训练令牌至5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。此模型为AWQ量化的4位指令调整0.5B参数版本，具有因果语言模型、预训练和后训练、transformers架构等特点。

Qwen2.5-Coder-0.5B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5，通过扩展训练令牌到5.5万亿，包括源代码、文本代码基础、合成数据等，Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM，其编码能力与GPT-4o相匹配。该模型不仅增强了编码能力，还保持了在数学和通用能力方面的优势，为实际应用如代码代理提供了更全面的基础。

Qwen2.5-Coder-1.5B-Instruct

Qwen2.5-Coder是Qwen大型语言模型的最新系列，专注于代码生成、代码推理和代码修复。基于Qwen2.5的强大能力，该模型在训练时使用了5.5万亿的源代码、文本代码基础、合成数据等，是目前开源代码生成语言模型中的佼佼者，编码能力与GPT-4o相媲美。它不仅增强了编码能力，还保持了在数学和通用能力方面的优势，为实际应用如代码代理提供了更全面的基础。

Lune AI

Lune AI是一个社区驱动的专家级大型语言模型（LLMs）市场，由开发者在技术主题上创建，以超越单独的AI模型。它通过集成各种技术知识源，如GitHub仓库、文档等，减少技术查询的幻觉，并提供准确的参考。Lune AI的API与OpenAI兼容，可以轻松集成到各种支持OpenAI兼容模型的工具中，如Cursor、Continue等。此外，Lune AI还提供了一个付费计划，用户可以通过贡献和创建Lunes来获得报酬。

SWE-RL

SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术，旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制，优化模型的推理能力，使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用，为软件工程领域带来了新的可能性。该技术目前处于研究阶段，尚未明确商业化定价，但其在提升开发效率和代码质量方面具有显著潜力。

暂无评论

您必须登录才能参与评论！

none

暂无评论...