DeepSeek Coder

已发布

最先进的开源代码生成模型

发布于 2024.01.17

概述

DeepSeek Coder 是一系列从头训练的代码语言模型,使用 2T tokens 训练,其中 87% 为代码,13% 为自然语言。在开源代码模型中达到最先进的性能。

主要特性

  • 87% 代码数据训练
  • 支持 86+ 编程语言
  • 支持代码填充功能
  • 16K 上下文窗口

技术规格

参数量
1.3B / 6.7B / 33B
架构
Transformer Decoder
上下文长度
16K tokens
训练数据量
2T tokens
许可证
DeepSeek License

资源