人工智能(AI)领域近期爆发了一场激烈的争议。以其革命性创新而闻名的巨头OpenAI,对迅速崛起并享誉全球AI界的中国初创公司DeepSeek发起了严厉指控。核心指控是什么?知识产权盗窃。这项指控于2025年1月最后一周浮出水面,声称DeepSeek不正当地使用了OpenAI模型的输出结果来改进其自身AI系统。
争议的核心在于一种名为“蒸馏”的技术。OpenAI声称DeepSeek利用其最先进模型生成的成果来训练更小、更高效的模型。这种做法虽然本身并不违法,但在OpenAI的服务条款中被明确禁止,尤其是在用于开发竞争性模型时。OpenAI提供的证据包括据称的屏幕截图,显示DeepSeek的回复与OpenAI的语言模型ChatGPT过于相似。
OpenAI的合作伙伴兼服务器基础设施提供商微软也发表声明,称已检测到来自中国的可疑数据活动,涉及大规模提取OpenAI的API数据。这家美国科技公司怀疑这些账户与DeepSeek有关。有趣的是,DeepSeek因开发出效率显著优于其他系统的AI模型而备受瞩目,其性能据说比其他系统高出10倍。这部分归功于该公司避免使用Nvidia的CUDA平台。相反,这家中国公司据称直接使用了Nvidia的线程并行执行,这是一种复杂且不寻常的方法。
在这场风波中,又出现了一位中国新玩家:阿里巴巴,它发布了模型Quen 2.5 Max。虽然它不是一个推理模型,但Quen 2.5 Max在特定基准测试中超越了DeepSeek、Claude和GPT-4o等模型。此外,另一个中国模型Kim 1.5也已发布,据称在某些方面超越了OpenAI的GPT-4o。这种情况表明,中国和美国在AI发展方面竞争激烈,而欧洲似乎专注于其他技术创新。
尽管面临指控和争议,DeepSeek也发布了Jan系列模型,专注于扩散图像生成。虽然其质量仍无法与Stable Diffusion或Midjourney等模型相比,但这项举措代表了另一个可用于商业用途的开源模型。此举强化了开源AI模型增长和重要性日益增长的趋势,这些模型提供了替代方案并使人们能够更容易地获得这项技术。