说说最像o1新模型:探索。

访客 270 0

deepseek 在 2024 年 11 月 20 日推出了支持深度思考的新模型 deepseek-r1-lite 预览版,现已在其官方网站上线[1]。这是首个类似于 open ai o1 深度思考模型的产品,领先于 claude、qwen 和 gemini 等其他模型。具体的性能评测数据可以在 deepseek 的官方博文中找到。

DeepSeek 推理模型预览版上线,解密 o1 推理过程

许多同学已经体验或了解了 DeepSeek 的深度思考能力。本文的目的不是展示其能力,而是探究 DeepSeek 背后的思考逻辑,并尝试编写 Prompt 让 DeepSeek 自己推导出思考过程,可以说是“以魔法对抗魔法”。文末将提供一个推导出的通用 Prompt。

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

1. 体验深度思考

我们测试了两个经典问题:“9.9 和 9.11 哪个大”和“Strawberry 有几个 r”。

9.9 和 9.11 哪个大

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

Strawberry 有几个 r

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

2. 魔法打败魔法

我们编写如下提示词,并复制第一步的思考过程,让 DeepSeek 进行深度思考并推导出可能的通用提示词。

DeepSeek 的深度思考过程如下:

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

最终得出的提示词是:

    问题理解 - 确保明确问题的要求和背景。 知识回顾 - 回顾相关知识或概念,为解决问题做准备。 数据准备 - 整理和准备所需的数据或信息。 详细分析 - 对问题进行详细的分解和分析。 验证假设 - 通过多种方法验证分析的正确性。 考虑例外情况 - 思考可能的特殊情况或边界条件。 得出结论 - 综合分析结果,得出最终结论。

3. 重测

我们关闭深度思考,并使用刚才获得的提示词,当然这个提示词需要稍作修改才能使用。

问题 1:Strawberry 有几个 r

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

回答如下,这是没有启用深度思考而得出的回答,可以看到他回答正确了,比深度思考还好用。

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

问题 2: 9.9 和 9.11 哪个大?

我们直接贴回答,推理步骤清晰,也同样获得了正确的答案。

最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建

总结

这个提示词非常好用,对于某些问题,使用这样的提示词效果甚至比深度思考更好,而且不会因为深度思考而等待过多的时间。

参考文献

[1] 官方网站: https://www.php.cn/link/6226c5b0f6a9b68f3dee542ab5c34545

以上就是最像o1新模型:探索 DeepSeek-R1-Lite 的思维逻辑与 Prompt 构建的详细内容,更多请关注楠楠科技社其它相关文章!

标签: #逻辑 #模型 #思维