05 · Data Analysis on CSVs
最重的一个案例:25 000 行用户数据 + 18 行平台聚合 + 4 道非平凡分析题
+ 1 份 Markdown 报告。DSCC 要自己挑工具(pandas、polars、awk
随它),通过 bash 驱动,然后产出数字正确的表格。
直接复用 demo/social_media_analysis/
下的真实数据。
演示能力
bash跑分析管道(pandas / awk)。read_file/write_file产出报告。DangerFullAccess权限:需要写/tmp/、执行任意 shell,见 guides/permissions.md 关于何时使用该模式。
准备
数据在 /tmp/social_analysis/:
social_media_user_behavior.csv— 25 000 行用户级数据,约 45 列。platform_statistics_2026.csv— 18 个平台聚合。
Prompt 直接用 demo/social_media_analysis/PROMPT.md,不在此处重复。
Python 3 + pandas 最省事;有 awk +
sort 也够。
运行命令
dscc --model claude-opus-4-6 \
--permission-mode danger-full-access \
prompt "$(cat demo/social_media_analysis/PROMPT.md)"
真实运行产物镜像在 report_dscc.md(模型实际写到
/tmp/social_analysis/report_dscc.md 的 Markdown)与 dscc_run.log,同步自 demo/social_media_analysis/
下的权威副本。
预期行为
模型通常会:
bashls /tmp/social_analysis/加几次head了解列名。bash跑 Python(或 awk)管道:- 把
addiction_level_1_to_10分为 Low/Medium/High; - 按用户数给平台排序前 5;
- 按
age_group算网暴率。
- 把
write_file(或bash重定向)把 Markdown 报告写到/tmp/social_analysis/report_dscc.md。
验收
/tmp/social_analysis/report_dscc.md存在。- 报告依次包含:成瘾分组、平台排名、年龄组网暴、一行结论。
- 数字按 prompt 要求保留两位小数。
- 结论不超过 80 字。
与参考报告 demo/social_media_analysis/report_dscc.md
对比,数字应在舍入范围内一致。