DeepSeek LLM

已发布

670 亿参数开源大语言模型,具备强大的双语能力

发布于 2024.01.05

概述

DeepSeek LLM 是一个强大的开源大语言模型,拥有 670 亿参数。它在各种基准测试中表现出色,支持中英双语。

主要特性

  • 670 亿参数
  • 中英文表现优异
  • 开源且许可宽松
  • 性能媲美 GPT-3.5

技术规格

参数量
67B
架构
Transformer Decoder
上下文长度
4K tokens
训练数据量
2T tokens
许可证
DeepSeek License

资源