Teacher Review Site · 2026-05-30
从前人研究到 SSCI 故事线:AI反馈与教师面批如何影响高中英语写作
这份报告的目的很具体:帮助你和老师决定哪一条论文主线最值得继续写。它不是把所有统计表堆出来,而是围绕 5 条候选故事线,逐条说明这条故事怎么讲、哪些数据支持、模型怎么算、证据够不够、还要补什么。
拿到这份报告怎么用
建议老师不要从技术表格开始读,而是先按故事线判断“这条线有没有论文价值”。统计模型和数据来源会放在每条故事线的证据链里,供需要时核对。
1. 先看每条线的“论文问题”
每条故事线都先给一句话主张和写法。如果这条主张本身不够有趣,就不用先纠结具体 p 值。
2. 再看数据能不能支撑
每条线下面都有“数据证据链”:原始文件、LMM 主模型、计划对比、探索性 gain 指标和辅助证据。
3. 最后决定补什么分析
如果老师认可某条线,再补人工编码、读后续写 Coh-Metrix、协变量模型或更明确的 planned contrasts。
报告里的 gain 是什么
gain = 后测分数 - 前测分数,只是为了直观看每组从前测到后测的变化方向,不是“收益率”,也不是最终模型的因变量。正式判断以 LMM 为主:LMM 直接使用前测和后测两行原始分数,模型为 Score ~ Time * Group + (1 | ID),其中 Time * Group 才是在检验不同反馈方式的变化是否不同。
大小作文/任务范围的总口径
当前正式统计主线只用应用文/小作文。原因是小作文已有完整前测、后测 Coh-Metrix 和分组表,可以统一做 LMM。读后续写/大作文现在只用于两类辅助判断:一是说明任务构念差异,二是查看 AI 反馈是否也给了类似建议;除非后续补齐读后续写前后测 Coh-Metrix,否则不把大小作文混在一起推出一个定量结论。
总口径与机制框架
先把任务、数据、统计和理论框架讲清楚,避免后面看故事线时产生“是不是在大小作文之间挑结论”的误解。
一句话总口径
本报告建议把论文主分析限定为应用文/小作文。小作文、应用文、practical writing 指同一类任务;大作文、读后续写、continuation writing 指另一类任务。当前只有应用文/小作文具备完整前后测 Coh-Metrix 与分组数据,可统一使用 LMM,因此正式故事线和研究问题应先围绕小作文展开。大作文/读后续写只用于说明任务边界、理论背景和后续扩展。
| 报告叫法 | 统一口径 | 当前用途 | 为什么这样处理 |
|---|---|---|---|
| 小作文 / 应用文 / practical writing | 同一个正式分析任务 | 主数据;做 LMM;支撑故事线 1/2/3/5 | 有完整前后测 Coh-Metrix、分组表和 75 名学生 ID,可复核。 |
| 大作文 / 读后续写 / continuation writing | 另一个任务,不与小作文混合 | 只作任务差异、理论边界和后续扩展 | 目前缺少与小作文同等口径的完整前后测 Coh-Metrix,强行混合会像挑结论。 |
| AI 反馈 Word 文档 | 过程证据,不是结果变量 | 解释 AI 给过什么建议,辅助判断 uptake 机制 | 它能说明反馈供给,不直接证明学生文本已经改变。 |
| 两篇前人硕士论文 | 同一实验链条的先行研究 | 提供实验设计、反馈机制和词汇/句法层结果 | 它们不是本次统计结果,但能说明本文如何在前人基础上推进到语篇资源。 |
| ScienceDirect/外部文献 | 理论与机制来源 | 支撑 feedback engagement、levels of language、genre/task-sensitive cohesion | 用于建立论文理论框架,而不是替代本地数据。 |
统一统计口径
- 正式模型:
Score ~ Time * Group + (1 | ID)。 Time * Group回答:三种反馈方式的前后测变化是否不同。- 计划对比回答:AI、教师、无反馈之间哪两个组的变化不同。
- gain 和 ANOVA 只用于探索方向和筛故事线,不作为论文主模型。
- 本报告按未校正 p 值筛选故事线;是否做多重比较校正留给定稿阶段和课题组口径。
建议采用的整合理论框架
任务约束下的反馈参与/采纳层级框架:反馈来源不同,先影响学生如何理解、信任和采纳反馈;这种 uptake 再以不同语言层级表现出来。AI 可能更快影响可操作的局部表达和任务立场资源,教师面批可能更有利于高阶语义组织和体裁判断;显性连接词数量则必须放回任务和体裁中解释。
这个框架整合 feedback engagement / feedback literacy、levels-of-language、genre/task-sensitive cohesion 三条理论,不把论文写成单纯“AI有没有用”。
机制环节 1:反馈供给
AI 与教师提供的建议类型不同:AI 更系统、直接、可复制;教师更具互动、追问、情境判断和情感支持。
机制环节 2:学习者参与/采纳
反馈是否有效取决于学生是否看懂、信任、筛选并把建议转化为文本修订,这就是 uptake 的关键。
机制环节 3:文本层级表现
短期内变化可能先出现在词汇、句法、stance、连接词等局部/显性资源;深层 coherence 需要更长周期或更强脚手架。
打包给老师时建议附上的相对路径
五条候选故事线
点击任意卡片查看详细讲法。建议会议中先讨论 01 和 02 是否能合并成主线,再决定 03-05 放在结果、讨论还是理论框架中。
从故事线到研究问题
论文最终不是按“故事线”写,而是按研究问题组织。这里把每条故事线能引出的 RQ 先列出来,后续可以反过来用 RQ 检查故事线是否聚焦、数据是否足够。
当前更稳妥的正式 RQ 组合
在应用文/小作文任务中,不同反馈方式是否会导致高中生英语写作语篇资源的前后测变化差异?
对应 LMM 的组间变化差异项;回答有没有反馈类型差异。
如果存在差异,这些差异主要体现在哪些语篇资源层面:任务立场表达、显性衔接、深层语义连贯,还是局部词汇/句法资源?
对应故事线 1/2/3/5;回答差异在哪里,避免和 RQ1 重复。
AI 反馈文本和前人反馈机制证据如何帮助解释上述变化模式?
放在 discussion 或 mixed-methods explanation 更合适,不与 RQ1/RQ2 并列成第三个中心问题。
建议:正式论文先用 2 个核心 RQ。故事线 4 作为任务边界和理论框架,不进入当前正式 RQ;AI 反馈文档作为解释性证据,帮助写讨论,不抢主问题位置。
候选研究问题池
前人研究具体做了什么
两篇硕士论文已经完成了同一实验框架下的句法和词汇层分析。本文不应重复它们,而应站在它们的反馈机制和任务设计之上,推进到 discourse/coherence 或 task-specific discourse resources。
AI反馈过程证据链
这部分不作为单独讨论主题,而是帮助判断每条故事线的机制是否可信:DeepSeek 实际给了什么建议,学生可能采纳了哪些建议,哪些故事线需要改写。
反馈类别覆盖
对 5 条故事线的直接影响
数据来源与计算口径
这一节不是让老师先看结果,而是说明每种证据从哪个文件来、由哪个脚本算出、在故事线里承担什么角色。这样后续讨论某条线时,可以快速追溯数据来源。
证据地图
展开:全指标探索中最强的组间信号
这些结果来自 explore_full_cohmetrix.R,用于发现候选指标;最终讲故事时优先看每条线内的 LMM 证据。
展开:原文 txt 特征快照
这些是轻量文本特征,帮助解释任务差异和文本表面变化,不替代 Coh-Metrix 或 LMM。
理论与前沿文献支点
SSCI 写作不能只有“哪个指标显著”,需要把发现放进反馈、体裁、任务复杂性和二语写作发展理论中。
建议会议讨论方式
建议不要一开始讨论“哪个 p 值显著”,而是先确定论文要讲的核心问题,再决定哪些指标和补充分析服务这个问题。
我建议优先讨论的主线组合
主线 1 + 主线 2 + 主线 3 最有机会形成完整论文:教师面批解释深层语义 uptake,AI 反馈解释应用文 stance-taking,连接词悖论作为反证,说明 feedback effects are task- and level-specific。
主线 4 可作为理论框架,主线 5 可作为讨论中解释非显著的机制。
是继续写 coherence/cohesion,还是改成 discourse resources / task-specific writing development?
先以应用文为主做确认分析,还是补齐读后续写 Coh-Metrix 后做任务调节?
是否把 AI 反馈文档和教师面批记录纳入正式分析,而不只是附录说明?
是否投入人工标注:否定表达功能、连接词适切性、深层连贯 uptake?
故事选定后再定 planned contrasts、协变量、指标族和校正方式。