Chain of Thoughts：通过示例释放LLM的潜力

Name: Jennie Rose

Published on 2024/4/30

深入探究Chain of Thoughts在大型语言模型中如何革新问题解决。学习逐步过程、优势和实际应用

欢迎阅读这份关于Chain of Thoughts的全面指南！如果你曾经想知道如何增强大型语言模型的推理能力，那么你来对地方了。这种技术在机器学习和自然语言处理领域中是一场革命性的变革。

在本文中，我们将深入探讨何为Chain of Thoughts、它的工作原理、其无数的优势以及实际应用。我们还将探索这种技术在Langchain、ChatGPT和Python等不同情境中的应用。那么，让我们开始吧！

何为Chain of Thoughts？

Chain of Thoughts是一种鼓励大型语言模型（LLM）逻辑顺序思考的技术。与传统的提示方法不同，Chain of Thoughts使得模型能够在每个阶段进行推理，当出现错误时可以切换到替代的方法。这样可以得到更准确可靠的输出。

如何工作？

其核心思想是向LLM提供一系列引导其思考过程的提示。每个提示都是一个“思维节点”，模型必须在进入下一个节点之前评估每个节点的输出。这样，模型就可以纠正自己偏离正轨的情况。

实施Chain of Thoughts就像为你的语言模型建立一张路线图。以下是操作步骤：

确定问题：明确定义您希望语言模型解决的多步骤问题。
分解问题：将问题分解为更小的任务或问题，从而得到最终解决方案。
创建提示：针对每个较小的任务，创建一个引导语言模型的提示。
执行：按顺序将这些提示提供给语言模型，收集每个步骤的输出。
分析和优化：评估输出并在必要时优化提示。

示例：假设您想解决一个关于计算汽车在旅途中的平均速度的数学题。您可以将问题分解为以下步骤，而不是直接要求模型解决问题：

计算总里程。
计算总时间。
使用公式计算平均速度： 平均速度 = 总里程 / 总时间

使用Chain of Thoughts的好处

增强推理和问题解决能力

Chain of Thoughts最引人注目的优点之一就是能够显著提高大型语言模型的推理能力。传统的语言模型在面对多步骤或复杂的推理任务时往往遇到困难。Chain of Thoughts有效地打破了这种困难。

准确性：通过将问题分解为更小的任务，模型可以专注于每个步骤，从而得到更准确的结果。
复杂任务：无论是解决数学问题还是理解复杂的情境，Chain of Thoughts让语言模型能够高效处理。

ChatGPT中的Chain of Thoughts

Chain of Thoughts示例

Chain of Thoughts（CoT）是一种先进技术，旨在使ChatGPT等大型语言模型（LLM）在推理过程中更加明确。与传统的提示方法不同，CoT使用一系列的“少样本示例”引导模型沿着逻辑步骤进行工作。这样能够得到更准确可靠的输出。

Chain of Thoughts

CoT的主要理念是使用这些少样本示例明确显示推理过程。当以这种方式提示模型时，它还会揭示其推理步骤，从而得到更准确和有洞察力的答案。

Chain of Thoughts评估

例如，使用传统的提示方法，GPT-3（davinci-003）无法解决一个简单的单词问题。然而，当应用Chain of Thoughts时，模型成功地解决了相同的问题。这证明了Chain of Thoughts在增强模型的问题解决能力方面的有效性。

在各种任务中，包括算术、常识推理和符号推理，CoT已经证明在提升LLM性能方面非常有效。具体来说，使用CoT提示的模型在GSM8K基准测试中实现了57%的解决准确率，这在当时被认为是最佳的。

Chain of Thoughts评估

值得注意的是，当使用较大的模型时，CoT的效果最为明显，尤其是约有1000亿参数的模型。较小的模型往往会产生不符合逻辑的思维链，这会对准确性产生负面影响。因此，CoT带来的性能提升通常与模型的规模成正比。

Langchain中的Chain of Thoughts

以下是Langchain在Python中使用CoT的方式：

from langchain.chains import SequentialChain
 
# 定义链条
chain1 = ...
chain2 = ...
chain3 = ...
chain4 = ...
 
# 连接链条
overall_chain = SequentialChain(chains=[chain1, chain2, chain3, chain4], input_variables=["input", "perfect_factors"], output_variables=["ranked_solutions"], verbose=True)
 
# 执行整体链条
```python
print(overall_chain({"input": "人类对火星的殖民", "perfect_factors": "地球和火星之间的距离非常远，导致定期补给困难"}))

这段代码展示了Langchain如何使用SequentialChain类连接多个链条。一个链条的输出成为下一个链条的输入，从而实现复杂的思路链条。

结论

关键要点总结

我们探索了一种令人着迷的思路链条生成（CoT）技术，这是一种改变ChatGPT和Langchain等大型语言模型（LLM）运行方式的技术。与传统的提示方法不同，CoT通过引导模型进行逻辑步骤的顺序，增强其推理和问题解决能力。这在需要复杂推理的任务中，能够提供更准确可靠的输出。

为什么CoT是一个改变游戏规则的技术？

CoT不仅仅是一种新技术，它在机器学习和自然语言处理领域是一个改变游戏规则的技术。通过使模型在推理过程中更为明确，CoT为需要复杂问题解决和逻辑推理的应用开辟了新的可能性。无论是算术任务、常识推理还是符号推理，CoT都被证明可以显著提高性能指标。

常见问题

Langchain中的思路链条生成是什么？

在Langchain中，思路链条生成是通过树形思路（Tree of Thoughts，ToT）算法来实现的，该算法结合了LLM和启发式搜索。它通过一系列的逻辑步骤引导模型处理更复杂的语言任务。

思路链条策略是什么？

思路链条策略是一种通过一系列逻辑步骤或“思路节点”引导模型推理过程的方法。每个节点都是一个提示，模型必须在继续之前对其进行评估，这样可以在跑偏时进行自我修正。

思路链条的示例是什么？

思路链条的一个示例是将复杂的数学问题分解为较小的任务，并逐步解决它们。例如，如果问题是求一个梯形的面积，思路链条可能包括计算两个平行边的平均值，然后求出高度，最后将它们相乘得到面积。

Claude提示工程指南-完整演练 Few-Shot Prompting: 实例详解