Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

1年前发布 15 00

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相匹配...

收录时间:
2025-05-30
Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8Qwen2.5-Coder-0.5B-Instruct-GPTQ-Int8

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成代码推理代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,编码能力与GPT-4o相匹配。此外,Qwen2.5-Coder还为真实世界应用提供了更全面的基础,如代码代理,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。

一丢导航 - 上一丢,不易丢

数据统计

相关导航

NovaSky

NovaSky

NovaSky 是一个专注于提升代码生成和推理模型性能的人工智能技术平台。它通过创新的测试时扩展技术(如 S*)、强化学习蒸馏推理等技术,显著提升了非推理模型的性能,使其在代码生成领域表现出色。该平台致力于为开发者提供高效、低成本的模型训练和优化解决方案,帮助他们在编程任务中实现更高的效率和准确性。NovaSky 的技术背景源于 Sky Computing Lab @ Berkeley,具有强大的学术支持和前沿的技术研究基础。目前,NovaSky 提供多种模型优化方法,包括但不限于推理成本优化和模型蒸馏技术,满足不同开发者的需求。
Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder-1.5B-Instruct-GGUF

Qwen2.5-Coder是Qwen大型语言模型的最新系列,专为代码生成、代码推理和代码修复而设计。基于强大的Qwen2.5,通过增加训练令牌至5.5万亿,包括源代码、文本代码基础、合成数据等,Qwen2.5-Coder-32B已成为当前最先进的开源代码大型语言模型,其编码能力与GPT-4o相匹配。此模型是1.5B参数的指令调优版本,采用GGUF格式,具有因果语言模型、预训练和后训练阶段、transformers架构等特点。
Windsurf Wave 3

Windsurf Wave 3

Windsurf Wave 3 是由 Codeium 团队开发的 AI 编辑器的重大更新版本,旨在通过一系列新功能和改进,为开发者提供更高效、更智能的编程体验。该产品支持多种 AI 模型和工具集成,能够显著提升代码生成、编辑和调试的效率。其主要优点包括强大的 AI 驱动功能、高度的可定制性以及对多种编程场景的支持。产品定位为高端开发工具,主要面向专业开发者和企业用户,价格策略可能涉及付费订阅或企业定制。
Learn Cursor

Learn Cursor

Learn Cursor 是一个专注于 Cursor AI 的学习平台,旨在为开发者提供系统的学习路径和丰富的教程资源。Cursor AI 是一款强大的 AI 编程助手,能够帮助开发者快速生成代码、优化编程流程,并提供智能提示。该平台通过整合互联网公开资源,为中文开发者提供高质量的学习内容,帮助他们更好地掌握 Cursor AI 的使用技巧,从而提升编程效率。Learn Cursor 作为非官方社区,致力于成为开发者学习和交流的平台,推动 AI 编程技术的普及。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...