一、核心准备
API 密钥获取:
新手选第三方平台(如聚合数据),注册后领取「京东商品详情 API」,获取
AppKey(调用 API 的唯一凭证);无需京东开放平台企业资质,免费版足够测试使用。
Python 依赖:
仅需安装
requests库(发送 HTTP 请求),命令:pip install requests。商品 ID 提取:
从京东商品 URL 中提取
sku_id(纯数字),如https://item.jd.com/100060195820.html中的100060195820。
二、核心采集流程(4 步)
1. 构造请求参数与请求头
参数:必填
key(你的 AppKey)、sku_id(商品 ID);请求头:必须加
User-Agent(模拟浏览器),否则 API 会拦截请求。
2. 发送 HTTP GET 请求
调用 API 地址(如聚合数据:
https://v.juhe.cn/jd/item/detail);设置超时时间(如 10 秒),避免程序无限等待。
3. 获取并解析 JSON 返回数据
先检查 HTTP 状态码(200 = 请求成功);
再检查 API 响应码(
error_code=0=API 调用成功);核心数据在
result字段中,包含标题、价格、库存等所有商品信息。
4. 数据提取 / 保存
按需提取核心字段(如价格、销量),用
dict.get()避免字段缺失报错;可选保存完整 JSON 数据到文件,便于后续分析。
三、核心注意点
避坑关键:
AppKey 错误会返回「APPKEY 不存在」,需核对复制的密钥;
商品 ID 无效会返回「商品不存在」,需确认 ID 是纯数字且商品未下架;
中文乱码:保存 JSON 时指定编码
utf-8,并设置ensure_ascii=False。数据类型:
API 返回的价格、销量等均为字符串(如价格
"99.9"),需手动转为数值类型(如float)才能计算。调用限制:
免费版 API 有调用次数 / 频率限制,避免短时间高频调用。