DSCC
主页 / cookbook / 05-data-analysis

05 · Data Analysis on CSVs

最重的一个案例:25 000 行用户数据 + 18 行平台聚合 + 4 道非平凡分析题 + 1 份 Markdown 报告。DSCC 要自己挑工具(pandas、polars、awk 随它),通过 bash 驱动,然后产出数字正确的表格。

直接复用 demo/social_media_analysis/ 下的真实数据。

演示能力

准备

数据在 /tmp/social_analysis/

Prompt 直接用 demo/social_media_analysis/PROMPT.md,不在此处重复。

Python 3 + pandas 最省事;有 awk + sort 也够。

运行命令

dscc --model claude-opus-4-6 \
  --permission-mode danger-full-access \
  prompt "$(cat demo/social_media_analysis/PROMPT.md)"

真实运行产物镜像在 report_dscc.md(模型实际写到 /tmp/social_analysis/report_dscc.md 的 Markdown)与 dscc_run.log,同步自 demo/social_media_analysis/ 下的权威副本。

预期行为

模型通常会:

  1. bash ls /tmp/social_analysis/ 加几次 head 了解列名。
  2. bash 跑 Python(或 awk)管道:
    • addiction_level_1_to_10 分为 Low/Medium/High;
    • 按用户数给平台排序前 5;
    • age_group 算网暴率。
  3. write_file(或 bash 重定向)把 Markdown 报告写到 /tmp/social_analysis/report_dscc.md

验收

与参考报告 demo/social_media_analysis/report_dscc.md 对比,数字应在舍入范围内一致。