DeepSeek-Coder-V2

已发布

GPT-4 Turbo 级别代码模型,支持 338 种语言

发布于 2024.06.17

概述

DeepSeek-Coder-V2 是一个开源代码模型,在代码特定任务上达到了与 GPT-4 Turbo 相当的性能。支持 338 种编程语言,上下文长度扩展到 128K。

主要特性

  • GPT-4 Turbo 级别性能
  • 支持 338 种编程语言
  • 128K 上下文窗口
  • 基于 DeepSeek-V2 架构

技术规格

参数量
236B (21B activated)
架构
MoE + MLA
上下文长度
128K tokens
许可证
DeepSeek License

资源