热门

Tencent-Hunyuan-Large

1年前发布 62 00

Tencent-Hunyuan-Large（混元大模型）是由腾讯推出的业界领先的开源大型混合专家（MoE）模型，拥有3890亿总参数和520亿激活参数。该模型在自然语言处理、计算机视觉和科学任务等领域取得了显著进展，特别是在处理长上下文输入和提升长上下文任务处理能力方面表现出色。混元大模型的开源，旨在激发更多研究者的创新灵感，共同推动AI...

收录时间：

2025-05-30

打开网站手机查看

生产力 # 人工智能 # 开源 # 混合专家模型 # 科学任务 # 自然语言处理 # 计算机视觉

Tencent-Hunyuan-Large

Tencent-Hunyuan-Large

Tencent-Hunyuan-Large（混元大模型）是由腾讯推出的业界领先的开源大型混合专家（MoE）模型，拥有3890亿总参数和520亿激活参数。该模型在自然语言处理、计算机视觉和科学任务等领域取得了显著进展，特别是在处理长上下文输入和提升长上下文任务处理能力方面表现出色。混元大模型的开源，旨在激发更多研究者的创新灵感，共同推动AI技术的进步和应用。

数据统计

相关导航

ChatGPT Task

ChatGPT 定时任务是 OpenAI 推出的一项新功能，允许用户设置特定时间触发的任务，如定期获取信息、练习语言等。它使用 GPT-4o 模型，适用于 Plus、Pro 和 Team 计划用户，目前处于 beta 阶段。主要优点是自动化执行任务，无论用户是否在线，都能按时完成并通知用户，提高工作和学习效率。

OneGen

OneGen是一个为大型语言模型（LLMs）设计的高效单遍生成和检索框架，用于微调生成、检索或混合任务。它的核心思想是将生成和检索任务整合到同一上下文中，通过将检索任务分配给以自回归方式生成的检索令牌，使得LLM能够在单次前向传递中执行两种任务。这种方法不仅降低了部署成本，还显著减少了推理成本，因为它避免了对查询进行两次前向传递计算的需求。

UI-TARS-desktop

UI-TARS-desktop 是由字节跳动开发的一款桌面客户端应用，它基于 UI-TARS 视觉语言模型，允许用户通过自然语言与计算机进行交互，完成各种任务。该产品利用先进的视觉语言模型技术，能够理解用户的自然语言指令，并通过屏幕截图和视觉识别功能实现精准的鼠标和键盘操作。它支持跨平台使用（Windows 和 macOS），并提供实时反馈和状态显示，极大地提高了用户的工作效率和交互体验。目前该产品在 GitHub 上开源，用户可以免费下载和使用。

π0

π0是一个通用型机器人基础模型，旨在通过实体化训练让AI系统获得物理智能，能够执行各种任务，就像大型语言模型和聊天机器人助手一样。π0通过训练在机器人上的实体经验获得物理智能，能够直接输出低级电机命令，控制多种不同的机器人，并可以针对特定应用场景进行微调。π0的开发代表了人工智能在物理世界应用方面的重要进步，它通过结合大规模多任务和多机器人数据收集以及新的网络架构，提供了迄今为止最有能力、最灵巧的通用型机器人政策。

OpenAI Agents SDK

OpenAI Agents SDK 是一个用于构建自主智能体的开发工具包。它基于 OpenAI 的先进模型能力，如高级推理、多模态交互和新的安全技术，为开发者提供了一种简化的方式来构建、部署和扩展可靠的智能体应用。该工具包不仅支持单智能体和多智能体工作流的编排，还集成了可观测性工具，帮助开发者追踪和优化智能体的执行流程。其主要优点包括易于配置的 LLM 模型、智能的智能体交接机制、可配置的安全检查以及强大的调试和性能优化功能。该工具包适用于需要自动化复杂任务的企业和开发者，旨在通过智能体技术提升生产力和效率。

GR-2

GR-2是一个先进的通用机器人代理，专为多样化和可泛化的机器人操作而设计。它首先在大量互联网视频上进行预训练，以捕捉世界的动态。这种大规模预训练涉及3800万视频剪辑和超过500亿个标记，使GR-2能够在随后的策略学习中跨广泛范围的机器人任务和环境进行泛化。随后，GR-2针对视频生成和动作预测进行了微调，使用机器人轨迹。它展示了令人印象深刻的多任务学习能力，在100多个任务中平均成功率达到97.7%。此外，GR-2在新的、以前未见过的场景中表现出色，包括新的背景、环境、对象和任务。值得注意的是，GR-2随着模型大小的增加而高效扩展，突显了其持续增长和应用的潜力。

JoyAgent-JDGenie

JoyAgent-JDGenie 是一个通用的多智能体框架，能够快速构建智能体产品，用户只需输入任务或查询，即可获得直接的解决方案。该产品强调高完成度和轻量化设计，具有较强的通用性，并在 GAIA 榜单上表现出色，适合于需要快速响应和高效执行的企业或开发者。该产品免费开源，定位于提供便捷的智能体开发解决方案。

FlexHeadFA

FlexHeadFA 是一个基于 FlashAttention 的改进模型，专注于提供快速且内存高效的精确注意力机制。它支持灵活的头维度配置，能够显著提升大语言模型的性能和效率。该模型的主要优点包括高效利用 GPU 资源、支持多种头维度配置以及与 FlashAttention-2 和 FlashAttention-3 兼容。它适用于需要高效计算和内存优化的深度学习场景，尤其在处理长序列数据时表现出色。

暂无评论

您必须登录才能参与评论！

none

暂无评论...