c++中如何解析json数据_c++解析json第三方库方法

nlohmann/json最省事,头文件直连、零构建依赖、语法近Python;rapidjson适合嵌入式,零依赖但API啰嗦;jsoncpp已过时,仅用于旧项目维护;均需严谨错误处理与输入校验。

用 nlohmann/json 最省事,头文件直接包含就能用

现代 C++ 项目里解析 JSON,nlohmann/json 是目前事实标准。它不依赖外部构建系统,只需把单个 json.hpp 文件放进工程或用 vcpkg/conan 安装即可。没有编译时链接步骤,也无需生成中间代码。

  • 支持 C++11 及以上,C++17 下自动启用结构化绑定等特性
  • 语法接近 Python:用 ["key"][0].dump() 等操作,不用写冗长的 DOM 遍历
  • 默认抛异常处理错误(如 key 不存在、类型不匹配),可配合 is_null()is_object() 等函数做安全访问
#include 
#include 
#include 

using json = nlohmann::json;

int main() {
    std::string s = R"({"name": "Alice", "age": 30, "hobbies": ["coding", "reading"]})";
    json j = json::parse(s);
    std::cout << j["name"].get() << "\n"; // Alice
    std::cout << j["hobbies"][1].get() << "\n"; // reading
}

rapidjson 更适合嵌入式或性能敏感场景

rapidjson 是 C++ 原生实现、零依赖、内存占用低,但 API 是基于 DOM/SAX 模型,需要手动检查类型和存在性,写起来更啰嗦。适用于对启动时间、内存峰值有硬性要求的环境(如车载、IoT 设备)。

  • 必须显式调用 IsObject()HasMember()IsString() 等判断,否则访问非法字段会崩溃
  • 不支持隐式类型转换,取值需用 GetString()GetInt() 等具体方法
  • 提供 ParseInsitu 模式可避免字符串拷贝,但会修改原始 buffer
#include "rapidjson/document.h"
#include "rapidjson/stringbuffer.h"
#include "rapidjson/writer.h"

using namespace rapidjson;

Document d;
d.Parse(R"({"count": 42, "active": true})");
if (d.HasMember("count") && d["count"].IsInt()) {
    int c = d["count"].GetInt(); // 必须先确认类型再取值
}
if (d.HasMember("active") && d["active"].IsBool()) {
    bool a = d["active"].GetBool();
}

jsoncpp 在旧项目中常见,但已基本被 nlohmann 替代

jsoncpp 曾是早期主流选择,但现在维护缓慢、C++11 支持弱、API 设计偏 C 风格(比如大量使用 isNull()isString()asCString())。除非维护遗留代码,否则不建议新项目选用。

  • 不能直接用 obj["key"] 获取子节点,必须用 obj.get("key", Json::Value::null) 并传默认值
  • 字符串返回的是 const char*,不是 std::string,容易引发悬垂指针
  • 没有原生支持 Unicode 路径或非 ASCII 键名的健壮处理

别忘了错误处理和输入校验

所有库都假设输入是合法 JSON 字符串,但真实场景中网络响应可能截断、编码错误或含 BOM。直接 parse 可能抛异常或静默失败。

立即学习“C++免费学习笔记(深入)”;

  • try/catch 捕获 nlohmann::json::parse_error,检查 e.byte 定位出错位置
  • 对来自不可信源的数据,先用 std::string_view 截断超长内容(如 >1MB),防 OOM
  • 如果 JSON 中字段类型不确定(比如 "score" 有时是 number 有时是 string),nlohmann 的 is_number() + get() 组合比强制 cast 更安全

真正麻烦的从来不是“怎么解析”,而是“怎么在字段缺失、类型突变、编码混乱、长度失控时还不崩”。这些细节不写进业务逻辑里,早晚出在线上。