Code Reasoning MCP Server
一个增强 Claude 解决复杂编程任务能力的模型上下文协议(MCP)服务器,通过结构化的逐步思考来实现。
这是什么?
Code Reasoning 是一个帮助 Claude 通过逐步思考方法将复杂编程问题分解为可管理步骤的工具。它能够:
- 对代码问题进行逐步推理
- 通过分支探索替代方法
- 在需要时修正之前的推理
- 详细记录思考过程
虽然基于逐步思考方法,但该服务器专门针对编程任务和代码分析进行了优化,因此命名为 "Code Reasoning"。
快速安装
与 Claude 一起使用
- 通过编辑以下文件配置 Claude Desktop:
~/Library/Application Support/Claude/claude_desktop_config.json
- 在提示中要求 Claude 使用逐步思考:
命令行选项
--debug
:启用详细日志记录
--help
或-h
:显示帮助信息
主要特性
- 编程专注:针对编码任务和问题解决进行了优化
- 结构化思考:将复杂问题分解为可管理的步骤
- 思考分支:并行探索多种解决方案路径
- 思考修正:随着理解的深入修正之前的推理
- 安全限制:在 20 个思考步骤后自动停止以防止循环
- 高级调试:全面的日志记录系统
文档
详细文档可在 docs 目录中找到:
- 使用示例:逐步思考的示例
- 配置指南:所有配置选项
- 发布指南:版本管理和发布
- 测试框架:测试信息
高级安装
从源代码安装:
项目结构
VS Code 集成
在 VS Code 设置中配置:
故障排除
- 调试问题时,使用
--debug
标志并检查日志~/.code-reasoning/logs/latest.log
- 参数错误时,确保使用 snake_case 格式(例如
thought_number
,而不是thoughtNumber
)
- 运行测试:
- 评估提示效果:
提示评估
Code Reasoning MCP Server 包含一个提示评估系统,用于评估 Claude 遵循代码推理提示的能力。该系统允许:
- 针对场景问题测试不同的提示变体
- 验证参数格式的遵循情况
- 评分解决方案质量
- 生成全面的报告
要使用提示评估系统,请运行:
提示比较与开发
我们投入了大量精力来开发 Code Reasoning 服务器的最佳提示。当前实现使用了 HYBRID_DESIGN 提示,该提示在我们的评估过程中胜出。
我们比较了四种不同的提示设计:
提示设计 | 描述 |
SEQUENTIAL | 原始的逐步思考提示设计 |
DEFAULT | 之前服务器中使用的基线提示 |
CODE_REASONING_0_30 | 专注于代码特定推理的实验性变体 |
HYBRID_DESIGN | 结合了其他方法最佳元素的优化设计 |
我们在七个不同的编程场景中的评估显示,HYBRID_DESIGN 优于其他提示:
场景 | HYBRID_DESIGN | CODE_REASONING_0_30 | DEFAULT | SEQUENTIAL |
算法选择 | 87% | 82% | 88% | 82% |
错误识别 | 87% | 91% | 88% | 92% |
多阶段实现 | 83% | 67% | 79% | 82% |
系统设计分析 | 82% | 87% | 78% | 82% |
代码调试任务 | 92% | 87% | 92% | 92% |
编译器优化 | 83% | 78% | 67% | 73% |
缓存策略 | 86% | 88% | 82% | 87% |
平均 | 86% | 83% | 82% | 84% |
HYBRID_DESIGN 提示在平均解决方案质量(86%)和所有场景中的一致性表现上略胜一筹,没有低于 80% 的分数。它还产生了最多的思考。
src/server.ts
文件已更新为使用此优化提示设计。我个人认为最大的改进是在提示末尾添加了:"✍️ 每个思考结束时询问:'我遗漏了什么或需要重新考虑什么?'"
有关提示评估系统的更多详细信息,请参见 测试框架。
许可证
本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。
- Author:waytomcp
- URL:https://www.waytomcp.com/article/mettamatt/code-reasoning
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!