跳动百科

上海交大张拳石:思维链只是表象,DeepSeek凭什么更强

柏桦玲   来源:网易

上海交通大学的张拳石教授指出,虽然“思维链”(Chain of Thought)机制在某些方面提高了模型的理解和推理能力,但其本质上只是一种表象。他强调,DeepSeek模型之所以更强大,并不单纯依赖于“思维链”,而是因为它在架构设计、学习算法以及数据处理等方面实现了更为全面和深入的创新。

DeepSeek模型通过引入一种新的注意力机制和优化策略,能够更高效地捕捉和利用数据中的复杂模式,从而在多种任务上展现出超越传统模型的表现。此外,该模型还特别注重对多模态信息(如文本、图像等)的融合处理,使其具备了更强的泛化能力和适应性。

总之,张拳石教授认为,DeepSeek之所以表现优异,关键在于其整体技术框架上的革新,而不仅仅是某个单一特性的增强。这一观点对于理解当前人工智能领域的进展具有重要意义。