主页 / cookbook / 05-data-analysis

05 · Data Analysis on CSVs

最重的一个案例：25 000 行用户数据 + 18 行平台聚合 + 4 道非平凡分析题 + 1 份 Markdown 报告。DSCC 要自己挑工具（pandas、polars、awk 随它），通过 bash 驱动，然后产出数字正确的表格。

直接复用 demo/social_media_analysis/ 下的真实数据。

演示能力

数据在 /tmp/social_analysis/：

Prompt 直接用 demo/social_media_analysis/PROMPT.md，不在此处重复。

Python 3 + pandas 最省事；有 awk + sort 也够。

dscc --model claude-opus-4-6 \
  --permission-mode danger-full-access \
  prompt "$(cat demo/social_media_analysis/PROMPT.md)"

真实运行产物镜像在 report_dscc.md（模型实际写到 /tmp/social_analysis/report_dscc.md 的 Markdown）与 dscc_run.log，同步自 demo/social_media_analysis/ 下的权威副本。

模型通常会：

bash ls /tmp/social_analysis/ 加几次 head 了解列名。
bash 跑 Python（或 awk）管道：
- 把 addiction_level_1_to_10 分为 Low/Medium/High；
- 按用户数给平台排序前 5；
- 按 age_group 算网暴率。
write_file（或 bash 重定向）把 Markdown 报告写到 /tmp/social_analysis/report_dscc.md。

与参考报告 demo/social_media_analysis/report_dscc.md 对比，数字应在舍入范围内一致。