DeepSeek AI涉嫌窃取OpenAI秘密？

人工智能（AI）领域近期爆发了一场激烈的争议。以其革命性创新而闻名的巨头OpenAI，对迅速崛起并享誉全球AI界的中国初创公司DeepSeek发起了严厉指控。核心指控是什么？知识产权盗窃。这项指控于2025年1月最后一周浮出水面，声称DeepSeek不正当地使用了OpenAI模型的输出结果来改进其自身AI系统。

争议的核心在于一种名为“蒸馏”的技术。OpenAI声称DeepSeek利用其最先进模型生成的成果来训练更小、更高效的模型。这种做法虽然本身并不违法，但在OpenAI的服务条款中被明确禁止，尤其是在用于开发竞争性模型时。OpenAI提供的证据包括据称的屏幕截图，显示DeepSeek的回复与OpenAI的语言模型ChatGPT过于相似。

OpenAI的合作伙伴兼服务器基础设施提供商微软也发表声明，称已检测到来自中国的可疑数据活动，涉及大规模提取OpenAI的API数据。这家美国科技公司怀疑这些账户与DeepSeek有关。有趣的是，DeepSeek因开发出效率显著优于其他系统的AI模型而备受瞩目，其性能据说比其他系统高出10倍。这部分归功于该公司避免使用Nvidia的CUDA平台。相反，这家中国公司据称直接使用了Nvidia的线程并行执行，这是一种复杂且不寻常的方法。

在这场风波中，又出现了一位中国新玩家：阿里巴巴，它发布了模型Quen 2.5 Max。虽然它不是一个推理模型，但Quen 2.5 Max在特定基准测试中超越了DeepSeek、Claude和GPT-4o等模型。此外，另一个中国模型Kim 1.5也已发布，据称在某些方面超越了OpenAI的GPT-4o。这种情况表明，中国和美国在AI发展方面竞争激烈，而欧洲似乎专注于其他技术创新。

尽管面临指控和争议，DeepSeek也发布了Jan系列模型，专注于扩散图像生成。虽然其质量仍无法与Stable Diffusion或Midjourney等模型相比，但这项举措代表了另一个可用于商业用途的开源模型。此举强化了开源AI模型增长和重要性日益增长的趋势，这些模型提供了替代方案并使人们能够更容易地获得这项技术。