首页/编程智能体/code-reasoning

code-reasoning

查看源码
2025-5-11
Words 1093Read Time 3 min
Score:90

专为编程任务优化的MCP服务器,通过结构化思维帮助Claude逐步解决复杂代码问题。

TypeScript

Code Reasoning MCP Server

一个增强 Claude 解决复杂编程任务能力的模型上下文协议(MCP)服务器,通过结构化的逐步思考来实现。

这是什么?

Code Reasoning 是一个帮助 Claude 通过逐步思考方法将复杂编程问题分解为可管理步骤的工具。它能够:
  • 对代码问题进行逐步推理
  • 通过分支探索替代方法
  • 在需要时修正之前的推理
  • 详细记录思考过程
虽然基于逐步思考方法,但该服务器专门针对编程任务和代码分析进行了优化,因此命名为 "Code Reasoning"。

快速安装

与 Claude 一起使用

  1. 通过编辑以下文件配置 Claude Desktop: ~/Library/Application Support/Claude/claude_desktop_config.json
    1. 在提示中要求 Claude 使用逐步思考:

      命令行选项

      • --debug:启用详细日志记录
      • --help-h:显示帮助信息

      主要特性

      • 编程专注:针对编码任务和问题解决进行了优化
      • 结构化思考:将复杂问题分解为可管理的步骤
      • 思考分支:并行探索多种解决方案路径
      • 思考修正:随着理解的深入修正之前的推理
      • 安全限制:在 20 个思考步骤后自动停止以防止循环
      • 高级调试:全面的日志记录系统

      文档

      详细文档可在 docs 目录中找到:
      • 使用示例:逐步思考的示例
      • 配置指南:所有配置选项
      • 发布指南:版本管理和发布
      • 测试框架:测试信息

      高级安装

      从源代码安装:

      项目结构

      VS Code 集成

      在 VS Code 设置中配置:

      故障排除

      • 调试问题时,使用 --debug 标志并检查日志 ~/.code-reasoning/logs/latest.log
      • 参数错误时,确保使用 snake_case 格式(例如 thought_number,而不是 thoughtNumber
      • 运行测试:
        • 评估提示效果:

          提示评估

          Code Reasoning MCP Server 包含一个提示评估系统,用于评估 Claude 遵循代码推理提示的能力。该系统允许:
          • 针对场景问题测试不同的提示变体
          • 验证参数格式的遵循情况
          • 评分解决方案质量
          • 生成全面的报告
          要使用提示评估系统,请运行:

          提示比较与开发

          我们投入了大量精力来开发 Code Reasoning 服务器的最佳提示。当前实现使用了 HYBRID_DESIGN 提示,该提示在我们的评估过程中胜出。
          我们比较了四种不同的提示设计:
          提示设计
          描述
          SEQUENTIAL
          原始的逐步思考提示设计
          DEFAULT
          之前服务器中使用的基线提示
          CODE_REASONING_0_30
          专注于代码特定推理的实验性变体
          HYBRID_DESIGN
          结合了其他方法最佳元素的优化设计
          我们在七个不同的编程场景中的评估显示,HYBRID_DESIGN 优于其他提示:
          场景
          HYBRID_DESIGN
          CODE_REASONING_0_30
          DEFAULT
          SEQUENTIAL
          算法选择
          87%
          82%
          88%
          82%
          错误识别
          87%
          91%
          88%
          92%
          多阶段实现
          83%
          67%
          79%
          82%
          系统设计分析
          82%
          87%
          78%
          82%
          代码调试任务
          92%
          87%
          92%
          92%
          编译器优化
          83%
          78%
          67%
          73%
          缓存策略
          86%
          88%
          82%
          87%
          平均
          86%
          83%
          82%
          84%
          HYBRID_DESIGN 提示在平均解决方案质量(86%)和所有场景中的一致性表现上略胜一筹,没有低于 80% 的分数。它还产生了最多的思考。src/server.ts 文件已更新为使用此优化提示设计。
          我个人认为最大的改进是在提示末尾添加了:"✍️ 每个思考结束时询问:'我遗漏了什么或需要重新考虑什么?'"
          有关提示评估系统的更多详细信息,请参见 测试框架。

          许可证

          本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。
          上一篇
          fm-mcp-servers
          下一篇
          fastmcp