Experiment results

使用大模型模拟PHQ-9问卷调查的实验

DeepSeek V3
100 profiles第1次实验(提示词未调整好)
整体结果 score_frequency severity_pie severity_bar
与受教育程度的关系 education_scores
与就业状态的关系 employment_scores
与性别的关系 gender_scores
与收入的关系 income_scores
与婚姻状况的关系 marital_status_scores
100 profiles第2次实验(提示词已调整好)
整体结果 score_frequency severity_pie severity_bar
与受教育程度的关系 education_scores
与就业状态的关系 employment_scores
与性别的关系 gender_scores
与收入的关系 income_scores
与婚姻状况的关系 marital_status_scores
1000 profiles第1次实验(过于乐观)
整体结果 score_distribution severity_pie severity_bar
与受教育程度的关系 education_comparison
与就业状态的关系 employment_comparison
与性别的关系 gender_comparison
与同居状况的关系 cohabitation_comparison
与收入的关系 income_group_comparison
与婚姻状况的关系 marital_status_comparison
与年龄的关系 age_group_comparison
1000 profiles第2次实验(未优化生成策略)
整体结果 score_distribution severity_pie severity_bar
与受教育程度的关系 education_comparison
与就业状态的关系 employment_comparison
与性别的关系 gender_comparison
与同居状况的关系 cohabitation_comparison
与收入的关系 income_group_comparison
与婚姻状况的关系 marital_status_comparison
与年龄的关系 age_group_comparison
1000 profiles第3次实验(新Profile+Background生成方法,但未优化做题的Prompt)
整体结果 severity_bar severity_pie score_distribution
与受教育程度的关系 education_comparison
与就业状态的关系 employment_comparison
与性别的关系 gender_comparison
与同居状况的关系 cohabitation_comparison
与收入的关系 income_group_comparison
与婚姻状况的关系 marital_status_comparison
与年龄的关系 age_group_comparison
1000 profiles第4次实验(优化思考Prompt+目前效果最好的一次)
整体结果 severity_bar severity_pie score_distribution
与受教育程度的关系 education_comparison
与就业状态的关系 employment_comparison
与性别的关系 gender_comparison
与同居状况的关系 cohabitation_comparison
与收入的关系 income_group_comparison
与婚姻状况的关系 marital_status_comparison
与年龄的关系 age_group_comparison
DeepSeek R1(比较失败)
100 profiles第1次实验(提示词未调整好)
整体结果 score_frequency
与受教育程度的关系 education_scores
与就业状态的关系 employment_scores
与性别的关系 gender_scores
与收入的关系 income_scores
与婚姻状况的关系 marital_status_scores
100 profiles第2次实验(提示词已调整好)
整体结果 score_frequency severity_pie severity_bar
与受教育程度的关系 education_scores
与就业状态的关系 employment_scores
与性别的关系 gender_scores
与收入的关系 income_scores
与婚姻状况的关系 marital_status_scores