如何导出数据?
了解如何从 CoreClaw 下载和导出采集的数据。
通过控制台下载
Section titled “通过控制台下载”步骤 1:访问运行结果
Section titled “步骤 1:访问运行结果”- 进入控制台的 运行记录
- 点击运行 ID
- 等待状态显示”SUCCEEDED”
步骤 2:查看结果
Section titled “步骤 2:查看结果”在运行详情页面,您可以看到:
- 执行状态
- 采集的项目数量
- 执行时长
- 日志记录
步骤 3:选择导出格式
Section titled “步骤 3:选择导出格式”选择您偏好的格式:
| 格式 | 扩展名 | 适用场景 |
|---|---|---|
| JSON | .json | 开发者、API 集成 |
| CSV | .csv | 电子表格、分析 |
步骤 4:下载
Section titled “步骤 4:下载”点击格式按钮下载您的数据。
通过 API 导出
Section titled “通过 API 导出”对于自动化数据检索,使用 API:
获取运行结果
Section titled “获取运行结果”GET /api/v1/runs/{run_slug}/results导出运行结果
Section titled “导出运行结果”POST /api/v1/runs/{run_slug}/export请求体:
{ "format": "csv", "filter_keys": "title,price,url"}支持的格式: csv、json
详见导出 API 完整文档。
数据大小注意事项
Section titled “数据大小注意事项”| 大小 | 推荐方法 |
|---|---|
| < 10MB | 控制台下载 |
| 10MB - 100MB | API 流式传输 |
| > 100MB | 联系支持 |
为什么下载按钮被禁用?
Section titled “为什么下载按钮被禁用?”可能的原因:
- 运行尚未完成
- 没有采集到数据
- 账户余额不足
- 权限受限
解决方案: 刷新页面或检查运行状态。
数据为空怎么办?
Section titled “数据为空怎么办?”检查以下内容:
- 输入参数是否正确
- 目标网站是否可访问
- 反爬措施是否阻止
查看日志了解详细错误信息。