DeepSeek-Coder-V2
已发布GPT-4 Turbo 级别代码模型,支持 338 种语言
发布于 2024.06.17
概述
DeepSeek-Coder-V2 是一个开源代码模型,在代码特定任务上达到了与 GPT-4 Turbo 相当的性能。支持 338 种编程语言,上下文长度扩展到 128K。
主要特性
- GPT-4 Turbo 级别性能
- 支持 338 种编程语言
- 128K 上下文窗口
- 基于 DeepSeek-V2 架构
技术规格
- 参数量
- 236B (21B activated)
- 架构
- MoE + MLA
- 上下文长度
- 128K tokens
- 许可证
- DeepSeek License