| 总体 | 样本 | 批改均值 | 批改中位数 | 批改非负均值 | 点评均值 | 点评中位数 | 点评非负均值 |
|---|---|---|---|---|---|---|---|
| 总体 | 73 | 6.9 | 8.0 | 7.5 | 6.7 | 8.0 | 7.4 |
| 题型 | 样本 | 批改均值 | 批改中位数 | 批改非负均值 | 点评均值 | 点评中位数 | 点评非负均值 |
|---|---|---|---|---|---|---|---|
| 归纳概括 | 43 | 7.4 | 8.0 | 7.8 | 6.5 | 7.0 | 7.3 |
| 提出对策 | 23 | 5.7 | 7.0 | 6.7 | 6.5 | 8.0 | 7.3 |
| 综合分析 | 7 | 8.0 | 9.0 | 8.0 | 8.3 | 9.0 | 8.3 |
批改尚可,但点评更容易出现解释偏差。
批改表现最弱,优先修规则边界与赋分口径。
当前最稳,可视为阶段性优势题型。
优势在于更容易形成共识,问题集中在采分稳定性与口径一致性。
优势在于能提供改进方向,问题集中在误判、过泛和教学适配性。
当前最集中争议主要体现在不同老师对结构逻辑、匹配口径和点评准确性的判断差异,这些问题决定了主观接受度,也决定了后续优化优先级。
| 项目 | 样本 | 批改均值 | 批改中位数 | 批改非负均值 | 点评均值 | 点评中位数 | 点评非负均值 |
|---|---|---|---|---|---|---|---|
| 1V1 | 30 | 7.3 | 8.0 | 7.6 | 6.3 | 7.0 | 7.4 |
| 步知 | 33 | 7.1 | 8.0 | 7.6 | 7.2 | 8.0 | 7.7 |
| 花木君 | 10 | 5.0 | 7.5 | 6.7 | 6.3 | 7.0 | 6.3 |
更关注结果是否能直接给学员使用。
更关注标准化、方法论和结构化一致性。
更关注表达开放性和基础学员可理解性。
| 项目 | 老师 | 样本 | 题型分布 | 批改均值 | 点评均值 | 置信度 | 说明 |
|---|---|---|---|---|---|---|---|
| 1V1 | 韩竹娟 | 10 | 综合分析6、归纳概括2、提出对策2 | 8.0 | 8.2 | 中 | 更关注匹配度、建议是否具体,以及练习建议是否贴题。 |
| 1V1 | 何蜀 | 10 | 归纳概括6、提出对策4 | 7.4 | 7.7 | 高 | 更关注点评准确性、层次逻辑和学员是否容易理解。 |
| 1V1 | 张福体 | 10 | 归纳概括8、提出对策2 | 6.5 | 2.9 | 低 | 更关注分类逻辑、重复赋分和点评误判,对结果边界较为敏感。 |
| 步知 | 彭天成 | 9 | 提出对策2、归纳概括6、综合分析1 | 6.7 | 6.1 | 中 | 更关注题型识别、表达规范和建议落地性,侧重规则是否清晰一致。 |
| 步知 | 钟亚 | 7 | 提出对策5、归纳概括2 | 6.9 | 7.3 | 中 | 更关注规则口径、点评准确性和总分计算一致性。 |
| 步知 | 周原也 | 10 | 归纳概括9、提出对策1 | 8.6 | 9.2 | 中 | 更关注语义匹配、逻辑自洽和前后表述一致性。 |
| 步知 | 朱玲 | 7 | 提出对策4、归纳概括3 | 5.7 | 5.4 | 低 | 更关注无依据给分、重复赋分以及层次梳理。 |
| 花木君 | 柳浩 | 10 | 归纳概括7、提出对策3 | 5.0 | 6.3 | 中 | 更关注表达开放性、用户体验和内容可读性。 |