DeepSeek LLM
已发布670 亿参数开源大语言模型,具备强大的双语能力
发布于 2024.01.05
概述
DeepSeek LLM 是一个强大的开源大语言模型,拥有 670 亿参数。它在各种基准测试中表现出色,支持中英双语。
主要特性
- 670 亿参数
- 中英文表现优异
- 开源且许可宽松
- 性能媲美 GPT-3.5
技术规格
- 参数量
- 67B
- 架构
- Transformer Decoder
- 上下文长度
- 4K tokens
- 训练数据量
- 2T tokens
- 许可证
- DeepSeek License