Teacher Review Site · 2026-05-30
从前人研究到 SSCI 故事线:AI反馈与教师面批如何影响高中英语写作
这份报告的目的很具体:帮助你和老师决定哪一条论文主线最值得继续写。它不是把所有统计表堆出来,而是围绕 5 条候选故事线,逐条说明这条故事怎么讲、哪些数据支持、模型怎么算、证据够不够、还要补什么。
拿到这份报告怎么用
建议老师不要从技术表格开始读,而是先按故事线判断“这条线有没有论文价值”。统计模型和数据来源会放在每条故事线的证据链里,供需要时核对。
1. 先看每条线的“论文问题”
每条故事线都先给一句话主张和写法。如果这条主张本身不够有趣,就不用先纠结具体 p 值。
2. 再看数据能不能支撑
每条线下面都有“数据证据链”:原始文件、LMM 主模型、计划对比、探索性 gain 指标和辅助证据。
3. 最后决定补什么分析
如果老师认可某条线,再补人工编码、读后续写 Coh-Metrix、协变量模型或更明确的 planned contrasts。
报告里的 gain 是什么
gain = 后测分数 - 前测分数,只是为了直观看每组从前测到后测的变化方向,不是“收益率”,也不是最终模型的因变量。正式判断以 LMM 为主:LMM 直接使用前测和后测两行原始分数,模型为 Score ~ Time * Group + (1 | ID),其中 Time * Group 才是在检验不同反馈方式的变化是否不同。
大小作文/任务范围的总口径
当前已经可以做大小作文共同核对。小作文已有完整前后测 Coh-Metrix 与分组表;读后续写/大作文也已补齐 continuation_data.csv。但统计口径不能把两类任务简单合并成一个总均值,而应把 Task 作为题材/任务维度:先看共同指标方向是否一致,再看 Time * Group * Task 是否提示任务调节。
总口径与机制框架
先把任务、数据、统计和理论框架讲清楚,避免后面看故事线时产生“是不是在大小作文之间挑结论”的误解。
一句话总口径
本报告建议把论文口径升级为“大小作文共同指向 + 任务调节核对”。小作文/应用文/practical writing 是一个任务;大作文/读后续写/continuation writing 是另一个任务。两类任务现在都有前后测整理表,可以共同检验反馈方式是否改变语篇衔接资源;但共同结论只限于重叠且方向一致的指标,不能把所有故事线都强行扩展到两个题材。
| 报告叫法 | 统一口径 | 当前用途 | 为什么这样处理 |
|---|---|---|---|
| 小作文 / 应用文 / practical writing | 同一个正式分析任务 | 主数据;做 LMM;支撑故事线 1/2/3/5 | 有完整前后测 Coh-Metrix、分组表和 75 名学生 ID,可复核。 |
| 大作文 / 读后续写 / continuation writing | 另一个正式核对任务 | 做跨题材一致性和任务调节分析 | 已补齐 69 名学生、3 组各 23 人的前后测整理表;适合单独 LMM 和合并 Task 模型。 |
| AI 反馈 Word 文档 | 过程证据,不是结果变量 | 解释 AI 给过什么建议,辅助判断 uptake 机制 | 它能说明反馈供给,不直接证明学生文本已经改变。 |
| 两篇前人硕士论文 | 同一实验链条的先行研究 | 提供实验设计、反馈机制和词汇/句法层结果 | 它们不是本次统计结果,但能说明本文如何在前人基础上推进到语篇资源。 |
| ScienceDirect/外部文献 | 理论与机制来源 | 支撑 feedback engagement、levels of language、genre/task-sensitive cohesion | 用于建立论文理论框架,而不是替代本地数据。 |
统一统计口径
- 正式模型:
Score ~ Time * Group + (1 | ID)。 Time * Group回答:三种反馈方式的前后测变化是否不同。- 计划对比回答:AI、教师、无反馈之间哪两个组的变化不同。
- gain 和 ANOVA 只用于探索方向和筛故事线,不作为论文主模型。
- 本报告按未校正 p 值筛选故事线;是否做多重比较校正留给定稿阶段和课题组口径。
建议采用的整合理论框架
任务约束下的反馈参与/采纳层级框架:反馈来源不同,先影响学生如何理解、信任和采纳反馈;这种 uptake 再以不同语言层级表现出来。AI 可能更快影响可操作的局部表达和任务立场资源,教师面批可能更有利于高阶语义组织和体裁判断;显性连接词数量则必须放回任务和体裁中解释。
这个框架整合 feedback engagement / feedback literacy、levels-of-language、genre/task-sensitive cohesion 三条理论,不把论文写成单纯“AI有没有用”。
机制环节 1:反馈供给
AI 与教师提供的建议类型不同:AI 更系统、直接、可复制;教师更具互动、追问、情境判断和情感支持。
机制环节 2:学习者参与/采纳
反馈是否有效取决于学生是否看懂、信任、筛选并把建议转化为文本修订,这就是 uptake 的关键。
机制环节 3:文本层级表现
短期内变化可能先出现在词汇、句法、stance、连接词等局部/显性资源;深层 coherence 需要更长周期或更强脚手架。
打包给老师时建议附上的相对路径
大小作文是否共同指向
这里专门回答补齐大作文后的核心问题:两个题材能不能共同支撑同一条论文主线,还是需要改写故事线和研究问题。
结论先行
10 个共同 Coh-Metrix 指标的方向核对
表中数值均为 gain = 后测均值 - 前测均值。shared p 检验两个任务共享的 Time × Group 效应;task p 检验 Time × Group × Task,即任务是否改变反馈效应。
对故事线/RQ 的调整建议
- 可以走“大小作文共同指向”,但主线应从“教师提升整体深层 coherence”改为“不同反馈方式改变语篇衔接资源的使用方式”。
- 最稳的共同证据是
CNCCaus:教师组在两个题材都下降,无反馈组在两个题材都上升,任务调节不明显。 LSASSp没有在大作文复现教师优势,因此不要把“段落语义相似度提升”写成跨题材主结论。CNCAdd明显受任务调节,适合放进讨论:表层连接词变化不是越多越好,而是随任务和反馈方式改变。
五条候选故事线
点击任意卡片查看详细讲法。建议会议中先讨论 01 和 02 是否能合并成主线,再决定 03-05 放在结果、讨论还是理论框架中。
从故事线到研究问题
论文最终不是按“故事线”写,而是按研究问题组织。这里把每条故事线能引出的 RQ 先列出来,后续可以反过来用 RQ 检查故事线是否聚焦、数据是否足够。
当前更稳妥的正式 RQ 组合
在应用文和读后续写两类任务中,不同反馈方式是否会导致高中生英语写作语篇衔接资源的前后测变化差异?
对应大小作文分别 LMM 和共同指标合并模型;回答有没有反馈类型差异。
这些反馈效应哪些是两个题材共同指向的,哪些会受到任务类型调节?
对应 Time × Group × Task;CNCCaus 更像共同信号,CNCAdd 更像任务敏感信号。
AI 反馈文本和前人反馈机制证据如何帮助解释上述变化模式?
放在 discussion 或 mixed-methods explanation 更合适,不与 RQ1/RQ2 并列成第三个中心问题。
建议:正式论文先用 2 个核心 RQ。故事线 4 不单独作为主线,而是嵌入 RQ2 的任务调节解释;AI 反馈文档作为解释性证据,帮助写讨论,不抢主问题位置。
候选研究问题池
前人研究具体做了什么
两篇硕士论文已经完成了同一实验框架下的句法和词汇层分析。本文不应重复它们,而应站在它们的反馈机制和任务设计之上,推进到 discourse/coherence 或 task-specific discourse resources。
AI反馈过程证据链
这部分不作为单独讨论主题,而是帮助判断每条故事线的机制是否可信:DeepSeek 实际给了什么建议,学生可能采纳了哪些建议,哪些故事线需要改写。
反馈类别覆盖
对 5 条故事线的直接影响
数据来源与计算口径
这一节不是让老师先看结果,而是说明每种证据从哪个文件来、由哪个脚本算出、在故事线里承担什么角色。这样后续讨论某条线时,可以快速追溯数据来源。
证据地图
展开:全指标探索中最强的组间信号
这些结果来自 explore_full_cohmetrix.R,用于发现候选指标;最终讲故事时优先看每条线内的 LMM 证据。
展开:原文 txt 特征快照
这些是轻量文本特征,帮助解释任务差异和文本表面变化,不替代 Coh-Metrix 或 LMM。
理论与前沿文献支点
SSCI 写作不能只有“哪个指标显著”,需要把发现放进反馈、体裁、任务复杂性和二语写作发展理论中。
建议会议讨论方式
建议不要一开始讨论“哪个 p 值显著”,而是先确定论文要讲的核心问题,再决定哪些指标和补充分析服务这个问题。
我建议优先讨论的主线组合
新的主线建议是“大小作文共同指向的语篇衔接资源重组”。以 CNCCaus 的跨题材一致性作为主证据,以 CNCAdd 的任务调节作为反证,说明 feedback effects are task- and level-specific,而不是简单提升整体 coherence。
原主线 1 需要降调:教师的 LSASSp 优势主要在小作文,不能泛化到大作文。原主线 2 可作为应用文特色发现,不适合作为跨题材核心。
是继续写 coherence/cohesion,还是改成 discourse resources / task-specific writing development?
建议用大小作文共同核对主线,但统计上保留 Task 维度,区分共同效应和任务调节。
是否把 AI 反馈文档和教师面批记录纳入正式分析,而不只是附录说明?
是否投入人工标注:否定表达功能、连接词适切性、深层连贯 uptake?
故事选定后再定 planned contrasts、协变量、指标族和校正方式。