Theory-first review version

反馈来源如何塑造二语写作中的语篇资源摄取

这版先把重心说死:论文亮点不是“有反馈是否好于无反馈”,而是 AI 反馈进入后,教师面批与 AI 反馈是否形成不同的语篇资源摄取路径。无反馈组只作为 baseline,必要时用于判断自然修改幅度,不作为主故事的比较对象。

75

小作文/应用文学生数。主线 LMM 审计表只看这一部分。

69

大作文/读后续写学生数。用于共同指标方向和任务边界复核。

T vs AI

共同指标优先看教师面批与 AI 反馈的变化差异。

Baseline

无反馈组只作基线参照,不再作为主论证中心。

Scope First

先把实验和数据口径讲清楚

当前报告不是“教师 vs 无反馈”的干预有效性报告。更高阶的论文口径是:在有 AI 反馈的新条件下,教师面批与 AI 反馈是否引导了不同的语篇资源变化;无反馈组只帮助判断自然前后测变化的背景水平。

口径结论必须先说

共同指标先看 Teacher-AI;No-Feedback 只是 baseline。

简要数据小作文 n=75,LMM 指标 108 个;大作文 n=69,LMM 指标 13 个;两者 Teacher-AI 可比交集 13 个。

这样论文亮点才落在 AI 反馈与教师面批的差异,而不是退回传统有反馈/无反馈比较。

模型结论论文口径

三组模型保留,但解释顺序改为 Teacher-AI 优先。

简要数据主线模型仍是 Score ~ Time * Group + (1 | ID);共同指标判读优先看 Teacher_change_minus_AI_change,再看 No-Feedback baseline。

这能保留实验完整性,同时避免把 baseline 组写成文章创新点。

主线表

只来自小作文/应用文。凡是讲情境模型、语义相似度、AI 局部语言摄取时,要标清“小作文证据”,不能伪装成双体裁共同证据。

共同表

同时看小作文和大作文的 13 个 Teacher-AI 可比指标;其中 10 个进入 combined-task 模型,另外 3 个只能做两体裁并排判读。

质控表

同时含大小作文异常残差敏感性分析。它只证明结论稳不稳,不生成正式 RQ,也不替代共同指标判断。

写法

正文先给判读,再给可展开数据表;文件路径只放在最后附录,避免读者被迫自己找 CSV。

小作文 / 应用文

75 名学生,前后测 Coh-Metrix 整理表。当前情境模型和局部语言线索主要来自这里,因此凡是只在小作文中出现的证据都要写成“主线探索”或“小作文主证”。

大作文 / 读后续写

69 名学生,前后测 Coh-Metrix 整理表。它不是尾注,而是检验共同指标能否跨体裁复现:能复现的指标增强论证,不能复现的指标变成边界条件。

Common Metrics First

从头重扫:共同 Teacher-AI 证据到底有没有

这次不只看原来的 10 个 combined overlap 指标,而是从 LMM 输出重新取交集:小作文有 108 个指标,大作文有 13 个指标,两者可直接比较 Teacher-AI 的共同指标有 13 个。结论很清楚:双体裁 Teacher-AI 同时显著的指标 = 0;双体裁都达到趋势水平的指标 = 0;方向一致的指标 = 9;至少一个体裁显著的共同指标 = 3。

结论 1:没有强共同证据T-A共同候选

没有发现“大小作文 Teacher-AI 都显著”的共同指标。因此不能把论文主结论写成“教师与 AI 的同一种差异在两个体裁中被强验证”。

最接近共同候选的是 CRFNO1CNCCausCRFAO1:它们方向能对上,但统计强度不足以做强结论。

结论 2:小作文更像机制丰富区单体裁AI差异

小作文中 Teacher-AI 显著指标更多,能分别触及情境模型、指称衔接、语义相似度和局部语言资源。

小作文 Teacher-AI 显著指标数 = 7;例:SMCAUSvp p=0.007,LSASSp p=0.041,CRFNO1 p=0.042。

结论 3:大作文更像体裁边界区任务调节AI差异

大作文中 Teacher-AI 显著指标目前只有 1 个,核心是 CNCAdd。这说明读后续写里反馈差异主要落在添加连接词这种表层衔接资源上。

T-A 小作文 +0.905, p=0.884;大作文 +14.555, p=0.028;Task 调节 p=0.035。

结论 4:两条写法路线不适合AI主线

路线 A 是把大小作文对比写成体裁调节问题,但目前强证据主要集中在 CNCAdd,问题会偏细。路线 B 是拆开写:小作文讲多层资源摄取,大作文讲读后续写中的连接词边界;这条边界更清楚。

展开:13 个共同指标的 Teacher-AI 全量重扫表
指标指标含义AI主线等级小作文 Teacher-AI大作文 Teacher-AI无反馈 baseline共同/任务证据可指向故事线判读
CRFNO1
Referential cohesion
相邻句名词重叠;反映相邻句是否通过重复名词维持指称对象。单体裁AI差异教师 +0.093
AI -0.012
T-A +0.105
p=0.042
教师 +0.055
AI -0.014
T-A +0.069
p=0.397
小作文 +0.032
大作文 +0.044
未进入 10 指标 task 模型名词指称衔接在小作文显著区分教师与AI,大作文同向但不显著这是重新扫描 13 个共同 LMM 指标后补回来的候选:小作文 Teacher-AI 显著,大作文同向但不显著;因为未进入 10 指标 combined-task 模型,不能直接宣称任务调节。
CNCCaus
Connectives
因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。T-A共同候选教师 -8.661
AI +1.247
T-A -9.908
p=0.105
教师 -7.107
AI -1.793
T-A -5.314
p=0.441
小作文 +3.667
大作文 +5.782
Shared p=0.022
Task p=0.824
教师与AI在因果连接变化上方向一致地分化教师组相对 AI 组在两个体裁中都更偏下降,但两个体裁内的 Teacher-AI 计划对比都未达显著;可作为 AI 主线候选,不能写成强确认结论。
CRFAO1
Referential cohesion
相邻句论元重叠;反映一个句子到下一个句子是否延续相同人物、对象或核心论元。T-A共同候选教师 +0.063
AI -0.027
T-A +0.090
p=0.114
教师 +0.043
AI -0.084
T-A +0.127
p=0.131
小作文 +0.039
大作文 +0.033
Shared p=0.062
Task p=0.865
教师与AI在指称衔接方向上分化教师组相对 AI 组在两个体裁中都更偏上升,方向一致但 p 值只是趋势附近;适合做 Teacher-AI 共同候选,不宜单独主扛。
CNCLogic
Connectives
逻辑连接词密度;反映推理、条件、转折等逻辑关系的显性标记。T-A弱候选教师 +2.107
AI -1.989
T-A +4.096
p=0.525
教师 +4.648
AI -1.528
T-A +6.176
p=0.399
小作文 +2.998
大作文 +3.280
Shared p=0.481
Task p=0.966
逻辑连接资源方向一致但证据弱教师组相对 AI 组在两个体裁中都更偏上升,但计划对比 p 值较弱;只能描述,不宜主写。
CRFCWO1
Referential cohesion
相邻句内容词重叠;反映相邻句是否复用关键实词来维持局部衔接。T-A弱候选教师 +0.010
AI -0.002
T-A +0.012
p=0.364
教师 -0.002
AI -0.033
T-A +0.031
p=0.133
小作文 +0.010
大作文 +0.006
Shared p=0.075
Task p=0.519
相邻句指称衔接弱线索Teacher-AI 方向在两个体裁一致,但数值和统计力度都弱;只放表格,不进入主故事。
CRFNOa
Referential cohesion
全文范围名词重叠;反映跨句名词重复带来的整体指称衔接。T-A弱候选教师 +0.025
AI +0.011
T-A +0.014
p=0.641
教师 +0.064
AI +0.005
T-A +0.059
p=0.406
小作文 +0.024
大作文 +0.032
未进入 10 指标 task 模型全文名词重叠方向一致但证据弱Teacher-AI 方向一致,但两个体裁内计划对比都较弱;只作为完整扫描透明信息。
LSASS1
Semantic overlap (LSA)
相邻句 LSA 语义相似度;反映句子之间概念内容是否接近。T-A弱候选教师 +0.019
AI -0.002
T-A +0.020
p=0.293
教师 +0.000
AI -0.014
T-A +0.014
p=0.489
小作文 +0.024
大作文 -0.005
Shared p=0.337
Task p=0.824
语义重叠弱线索Teacher-AI 方向一致,但两个体裁 p 值都弱;只能作为低优先级线索。
CNCAdd
Connectives
添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。任务调节AI差异教师 +1.818
AI +0.913
T-A +0.905
p=0.884
教师 +11.133
AI -3.422
T-A +14.555
p=0.028
小作文 +9.957
大作文 -3.486
Shared p=0.247
Task p=0.035
添加连接词的 Teacher-AI 差异主要出现在大作文Teacher-AI 方向一致,但大作文显著、小作文几乎没有差异,且 Task 调节显著;它说明 AI/教师差异受体裁影响。
LSASSp
Semantic overlap (LSA)
相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。单体裁AI差异教师 +0.044
AI -0.015
T-A +0.058
p=0.041
教师 +0.002
AI +0.005
T-A -0.003
p=0.841
小作文 +0.022
大作文 -0.010
Shared p=0.182
Task p=0.112
语义相似度只在小作文区分教师与AI小作文 Teacher-AI 计划对比显著,但大作文方向反转且不显著;可写成小作文机制线索,不能写成跨体裁 AI 结论。
CNCADC
Connectives
连接词密度中的扩展/类别化连接资源指标,用来观察显性衔接标记是否整体变化。不适合AI主线教师 +0.932
AI +3.573
T-A -2.640
p=0.440
教师 +4.575
AI +0.397
T-A +4.178
p=0.251
小作文 -0.357
大作文 +0.235
未进入 10 指标 task 模型扩展连接资源方向不一致Teacher-AI 方向在两个体裁不一致,且两个体裁内计划对比都不显著;不进入 AI 主线。
LSAGN
Semantic overlap (LSA)
语义 given-new 重叠;反映新句子与前文共享概念的程度。不适合AI主线教师 -0.002
AI -0.004
T-A +0.002
p=0.861
教师 +0.016
AI +0.021
T-A -0.004
p=0.818
小作文 +0.006
大作文 +0.007
Shared p=0.987
Task p=0.511
全局语义重叠不稳定Teacher-AI 方向在两个体裁不一致,统计证据也弱;不进入 AI 主线。
CNCAll
Connectives
所有连接词总密度;反映显性连接标记总体使用,但太粗,不能单独说明高质量连贯。不适合AI主线教师 -1.760
AI +2.514
T-A -4.274
p=0.625
教师 +8.572
AI -2.619
T-A +11.191
p=0.265
小作文 +15.136
大作文 -1.344
Shared p=0.554
Task p=0.123
总连接词不适合做主指标Teacher-AI 方向在两个体裁相反;总连接词太粗,不适合支撑 AI 相关统一故事。
CNCTemp
Connectives
时间连接词密度,例如 then、after、when;反映事件时间顺序的显性组织。T-A弱候选教师 +2.574
AI +1.403
T-A +1.171
p=0.750
教师 +0.897
AI -5.611
T-A +6.508
p=0.185
小作文 +2.247
大作文 -1.350
Shared p=0.447
Task p=0.663
时间连接词方向一致但证据弱Teacher-AI 方向一致,但两个体裁内计划对比不显著;最多作为描述性补充。
展开:小作文主线 LMM 审计表

这张表只给小作文主线证据。它可以支撑小作文内的机制讨论,但不能自动升级成双体裁共同证据。

故事候选指标指标含义Time×Group p最强组变化值组内 p计划对比 p证据标记
teacher_deep_coherenceLSASSp
Semantic overlap (LSA)
相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。0.106Teacher+0.0440.0300.041directional_or_planned_contrast
teacher_deep_coherenceCNCCaus
Connectives
因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。0.095Teacher-8.6610.0460.045directional_or_planned_contrast
teacher_deep_coherenceSMCAUSv
Situation model
情境模型中的因果动词/事件连贯指标;反映文本事件因果组织的变化。0.017Teacher-6.9470.0630.011interaction_supported
teacher_deep_coherenceSMCAUSvp
Situation model
情境模型中的因果动词短语连贯指标;反映更高层事件因果链条的组织。0.006Teacher-10.5520.0310.005interaction_supported
teacher_deep_coherenceSMCAUSwn
Situation model
基于词网语义关系的因果连贯指标;反映事件因果关系是否在语义层面更连贯。0.021No_Feedback+0.0430.0220.006interaction_supported
ai_stance_negationDRNEG
Verb / phrase density
否定相关词项密度;反映文本中否定表达或否定语义资源的使用。<.001No_Feedback-4.9880.001<.001interaction_supported
ai_stance_negationDRINF
Verb / phrase density
不定式/动词形式相关密度;反映局部句法和动词短语资源变化。0.072AI-7.5870.0080.047directional_or_planned_contrast
ai_stance_negationWRDPOLc
Word information
词汇极性/情感取向相关指标;反映词语情感色彩或极性变化。<.001Teacher-0.357<.001<.001interaction_supported
ai_stance_negationLDVOCD
Lexical diversity
词汇多样性,关注词汇是否丰富、重复是否较少。0.069AI+22.4780.0690.044directional_or_planned_contrast
connectives_not_enoughCNCAll
Connectives
所有连接词总密度;反映显性连接标记总体使用,但太粗,不能单独说明高质量连贯。0.127No_Feedback+15.1360.0160.056within_group_only
connectives_not_enoughCNCAdd
Connectives
添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。0.263No_Feedback+9.9570.0250.146within_group_only
connectives_not_enoughCNCPos
Connectives
连接词密度,关注因果、时间、逻辑、添加等显性衔接标记。0.082No_Feedback+13.1320.0320.031directional_or_planned_contrast
connectives_not_enoughPCREFp
Text easability component
指称衔接可读性主成分百分位;反映整体指称衔接对文本可读性的贡献。0.019No_Feedback+9.2160.0160.006interaction_supported
connectives_not_enoughLSAGNd
Semantic overlap (LSA)
语义 given-new 重叠离散度;反映语义承接在文本内部是否稳定。0.021No_Feedback+0.0180.0330.012interaction_supported
genre_task_moderationCNCTemp
Connectives
时间连接词密度,例如 then、after、when;反映事件时间顺序的显性组织。0.945Teacher+2.5740.3230.750weak_or_descriptive
genre_task_moderationCNCLogic
Connectives
逻辑连接词密度;反映推理、条件、转折等逻辑关系的显性标记。0.701No_Feedback+2.9980.5110.440weak_or_descriptive
genre_task_moderationCRFAO1
Referential cohesion
相邻句论元重叠;反映一个句子到下一个句子是否延续相同人物、对象或核心论元。0.247Teacher+0.0630.1160.114weak_or_descriptive
genre_task_moderationCRFCWO1
Referential cohesion
相邻句内容词重叠;反映相邻句是否复用关键实词来维持局部衔接。0.553No_Feedback+0.0100.2780.350weak_or_descriptive
local_discourse_asynchronyWRDPOLc
Word information
词汇极性/情感取向相关指标;反映词语情感色彩或极性变化。<.001Teacher-0.357<.001<.001interaction_supported
local_discourse_asynchronyWRDFRQa
Word information
平均词频指标;反映学生是否更多使用常见或低频词。0.016Teacher-0.0800.0020.009interaction_supported
local_discourse_asynchronyWRDFRQc
Word information
内容词词频指标;反映实义词常见程度或词汇选择难度。0.023Teacher-0.113<.0010.007interaction_supported
local_discourse_asynchronyLDVOCD
Lexical diversity
词汇多样性,关注词汇是否丰富、重复是否较少。0.069AI+22.4780.0690.044directional_or_planned_contrast
local_discourse_asynchronySYNNP
Syntactic complexity / density
名词短语句法密度;反映句法压缩和名词化信息承载。0.018No_Feedback-0.0690.0210.011interaction_supported
展开:异常残差敏感性表

这张表只回答稳健性,不回答故事线本身。

任务指标指标含义总观测剔除观测完整模型 p修剪模型 p完整计划对比 p修剪计划对比 p
小作文/应用文CNCCaus
Connectives
因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。15020.0950.0250.0450.017
小作文/应用文CRFAO1
Referential cohesion
相邻句论元重叠;反映一个句子到下一个句子是否延续相同人物、对象或核心论元。15010.2470.2700.1140.114
小作文/应用文CNCLogic
Connectives
逻辑连接词密度;反映推理、条件、转折等逻辑关系的显性标记。15010.7010.9070.4400.693
小作文/应用文CNCAdd
Connectives
添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。15000.2630.2630.1460.146
小作文/应用文LSASSp
Semantic overlap (LSA)
相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。15000.1060.1060.0410.041
大作文/读后续写CNCCaus
Connectives
因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。13830.1590.4240.0640.289
大作文/读后续写CRFAO1
Referential cohesion
相邻句论元重叠;反映一个句子到下一个句子是否延续相同人物、对象或核心论元。13830.2290.0920.1310.075
大作文/读后续写CNCLogic
Connectives
逻辑连接词密度;反映推理、条件、转折等逻辑关系的显性标记。13830.6610.5530.3990.358
大作文/读后续写CNCAdd
Connectives
添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。13820.0350.0210.0270.025
大作文/读后续写LSASSp
Semantic overlap (LSA)
相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。13840.4690.7080.2610.493

Problem Chain

按写作包重建问题链

重要性

AI 写作反馈进入高中英语写作教学,但“反馈有用吗”这个问题太泛。更有论文价值的问题是:不同反馈来源是否改变学生实际摄取的写作资源层级。

缺口

前人反馈研究常关注纠错、分数、修改数量或局部语言表现;现有数据可以把问题推进到语篇层面,观察连接词、指称重叠、语义相似度和情境模型指标如何变化。

当前研究动作

使用前后测设计比较 AI反馈、教师面批和无反馈三组学生的 Coh-Metrix 语篇资源变化。主模型是 Time × Group,而不是任务之间的无限比较。

贡献落点

把 AI反馈放入二语写作反馈参与和摄取框架中,说明不同反馈来源可能引导不同层级的语篇资源变化,而不是简单判断 AI 或教师哪个“更好”。

Theoretical Frame

建议理论框架:反馈参与与语篇资源摄取

最合适的理论框架不是“跨任务泛化”,而是 feedback engagement / uptake:反馈只有被学习者注意、理解、加工并转化到修改中,才会在文本资源上留下痕迹。AI反馈和教师面批的差异,可以被解释为不同反馈来源提供了不同的互动性、解释性、可信度和脚手架。

Noticing / Intake

反馈先改变学习者注意到什么问题。没有注意与理解,就不会形成 intake;所以 Time 的意义是看反馈后资源是否真的进入文本。

Schmidt, 1990. DOI: 10.1093/applin/11.2.129;Ellis, 2009. DOI: 10.1093/elt/ccn023

Feedback engagement

反馈效果取决于学习者的认知、行为和情感参与,而不是反馈信息本身自动生效。教师面批的价值可以从互动解释和脚手架进入。

Hyland & Hyland, 2006. DOI: 10.1017/S0261444806003399;Han & Hyland, 2015. DOI: 10.1016/j.jslw.2015.08.002

Automated feedback uptake

自动反馈可获得、即时,但学习者是否采纳还受可操作性、信任和自身目标影响;这为 AI反馈与教师面批的资源层级差异提供理论入口。

Zhang & Hyland, 2018. DOI: 10.1016/j.asw.2018.02.004;Ranalli, 2021. DOI: 10.1016/j.jslw.2021.100816

为什么不把“任务差异”放成理论中心

题材当然会影响 Coh-Metrix 指标,但如果论文中心写成 Task,文章会滑向“应用文和读后续写怎么不同”这个无穷比较。当前更好的理论入口是反馈来源如何通过 engagement/uptake 改变资源摄取;Task 只检查这个解释在哪些写作题材上更稳。

Storyline

故事线必须从共同指标地图里长出来

现在的故事线不再围绕传统基线比较,而是围绕 AI 引入后教师面批与 AI 反馈的差异。无反馈只在需要判断 baseline 时出现。

全量重扫后的主线判断是:共同证据很少,而且没有“双体裁 Teacher-AI 都显著”的指标。因此不要硬写共同验证;更清晰的写法是先报告共同证据不足,再把大小作文拆开:小作文显示多层资源摄取差异,大作文显示连接词层面的体裁边界。

简要数据共同 Teacher-AI 指标 13 个;双体裁同时显著 0 个;方向一致 9 个;至少一个体裁显著 3 个。CRFNO1 小作文 T-A +0.105, p=0.042;大作文 +0.069, p=0.397。

这比传统有反馈/无反馈主线更贴近论文创新点:AI 是核心比较对象,无反馈只是 baseline。

共同证据不足:不要硬凑跨体裁强结论

13 个 Teacher-AI 可比指标中没有双体裁都显著的指标。方向一致只能说明有候选,不足以说“两个体裁共同验证了同一结论”。

简要数据共同候选:CRFNO1 小作文 p=0.042、大作文 p=0.397;CNCCaus 小作文 p=0.105、大作文 p=0.441;CRFAO1 小作文 p=0.114、大作文 p=0.131。

用法:作为 Results 开头的筛选结论,先把边界讲清楚。

拆分路线:小作文指向多层资源摄取差异

小作文 Teacher-AI 显著指标较多,覆盖情境模型、段落语义相似度、名词指称衔接和局部语言密度。它更适合承载机制讨论。

简要数据小作文:Teacher-AI 显著指标 7 个;SMCAUSvp T-A -18.962, p=0.007;LSASSp T-A +0.058, p=0.041。

用法:如果决定拆开大小作文,这是小作文 Results 的主线。

拆分路线:大作文指向表层连接词边界

大作文 Teacher-AI 显著指标目前只集中在添加连接词,说明读后续写任务里反馈来源差异更多体现为表层衔接资源,而不是广泛语篇资源重组。

简要数据大作文:Teacher-AI 显著指标 1 个;CNCAdd T-A +14.555, p=0.028;小作文对应 T-A +0.905, p=0.884。

用法:作为大作文 Results 或边界检验小节,不要伪装成全局结论。

体裁对比路线:可以写,但问题会更细

如果主打大小作文对比,最强抓手是 CNCAdd 的任务调节;但这条路线会把论文重心推向“读后续写是否更容易出现连接词层面差异”,理论宽度比 Teacher-AI uptake 小。

简要数据共同指标:CNCAdd T-A 小作文 +0.905, p=0.884;大作文 +14.555, p=0.028;Task调节 p=0.035。

用法:更适合做边界检验,不建议单独升级为论文主问题。

AI反馈:目前仍是小作文局部语言线索

AI反馈相关线索主要来自小作文主线审计,而不是共同指标复核;它可以进入 Discussion,但不应抢占 Teacher-AI 共同候选的位置。

简要数据小作文:DRINF AI组 Δ=-7.587, p=0.008;Time×Group p=0.072。

用法:除非补做 AI 建议-学生修改的人工编码,否则不建议写成正式 RQ。

暂不采用:总连接词和部分语义相似度指标

CNCAll、LSAGN 等 Teacher-AI 方向不一致;LSASSp 只在小作文区分教师与 AI。它们留在表里是透明性,不是跨体裁 AI 故事线素材。

简要数据共同指标示例:CNCAll T-A 两个体裁方向相反;LSASSp T-A 小作文 p=0.041,大作文 p=0.841。

用法:不要把这些指标强行塞进主线;它们更适合说明边界和筛选原则。

Metric Glossary

进入故事线的指标先解释

SMCAUSvp / SMCAUSv / SMCAUSwn
情境模型中的因果/语义连贯指标

用于观察文本中事件、动作、因果关系等更高层级语义结构是否发生变化。它们比单纯数连接词更接近语篇组织层面。

CRFNO1 / CRFNOa / CRFAO1
指称衔接指标

用于观察名词、论元或核心指称对象是否在相邻句或全文中延续。它们反映局部衔接,不等于内容质量本身。

CNCCaus
因果连接词出现率

because / so / therefore 一类显性因果连接资源的密度。下降不自动等于更好,需要结合文本例证判断是否是更选择性使用。

CNCAdd
添加/并列连接词出现率

and / also / moreover 一类添加连接资源。它能反映表层衔接标记增加,但不能直接证明高质量连贯。

LSASSp
句际语义相似度

用于观察句子之间概念上是否更接近。它可辅助解释语义整合,但不宜单独撑起主结论。

DRNEG / WRDPOLc
局部语言与词汇信息指标

用于辅助解释 AI反馈可能引发的局部表达变化。它们不等于语篇连贯本身,所以不放主 RQ。

Research Questions

建议正式 RQ:围绕教师反馈与 AI 反馈

RQ1

教师面批与 AI 反馈是否会导致学习者语篇衔接资源的前后测变化不同?

英文候选:How do teacher face-to-face feedback and AI-assisted feedback differentially affect EFL learners' pre-to-post changes in discourse cohesion resources?

主答题口径:三组模型保留,但解释优先看 Teacher-AI change contrast;No-Feedback 只作为 baseline。共同指标另看 Task 边界。

RQ2

教师面批与 AI 反馈的差异主要体现在哪些语篇资源层面?

英文候选:At which levels of discourse cohesion resources do teacher feedback and AI-assisted feedback diverge?

主答题口径:先看共同指标中的 Teacher-AI 候选,再用小作文情境模型与局部语言指标解释可能的资源层级。这个 RQ 是理论化的,不是指标清单。

BC

边界检验:Teacher-AI 差异在读后续写任务中是否复现或被任务调节?

英文候选:To what extent are teacher-AI differences replicated, weakened, or task-moderated in continuation writing?

这不是正式 RQ,而是 Results 末尾或补充分析小节。它明确告诉老师:大作文已经看了,但它的功能是检查 AI/教师差异的体裁边界。

不建议放进正式 RQ 的内容

不要把“异常残差/二次建模”“两个任务是否完全一致”写成正式 RQ。前者是方法质控,后者是边界检验。它们服务主问题,不是论文主问题。

Evidence Chain

论证怎么落到数据:先 Teacher-AI,再 baseline

论证 1T-A共同候选

全量重扫后,没有强跨体裁 Teacher-AI 共同证据。

简要数据共同可比指标 13 个;双体裁同时显著 0 个;双体裁都 p<.10 的指标 0 个;方向一致 9 个。

这是当前报告最重要的边界判断,避免把弱候选写成强结论。

论证 2小作文主证

小作文可拆出多层 Teacher-AI 差异。

简要数据SMCAUSvp 情境模型因果连贯 T-A -18.962, p=0.007;CRFNO1 名词指称衔接 T-A +0.105, p=0.042。

这条适合写成小作文内部机制,不应外推为大作文共同结果。

论证 3大作文边界

大作文目前只稳定指向添加连接词边界。

简要数据CNCAdd 添加连接词密度:T-A 小作文 +0.905, p=0.884;大作文 +14.555, p=0.028。

这说明读后续写任务下教师与 AI 的差异主要在表层衔接标记。

论证 4任务调节AI差异

任务边界:添加连接词的 Teacher-AI 差异主要在大作文出现。

简要数据CNCAdd T-A 小作文 +0.905, p=0.884;大作文 +14.555, p=0.028;Task调节 p=0.035。

它支持“体裁是边界条件”,不支持把添加连接词写成共同主线。

展开:共同指标 Teacher-AI 并排数据
指标指标含义AI主线等级小作文 Teacher-AI大作文 Teacher-AI无反馈 baseline共同/任务证据可指向故事线判读
CRFNO1
Referential cohesion
相邻句名词重叠;反映相邻句是否通过重复名词维持指称对象。单体裁AI差异教师 +0.093
AI -0.012
T-A +0.105
p=0.042
教师 +0.055
AI -0.014
T-A +0.069
p=0.397
小作文 +0.032
大作文 +0.044
未进入 10 指标 task 模型名词指称衔接在小作文显著区分教师与AI,大作文同向但不显著这是重新扫描 13 个共同 LMM 指标后补回来的候选:小作文 Teacher-AI 显著,大作文同向但不显著;因为未进入 10 指标 combined-task 模型,不能直接宣称任务调节。
CNCCaus
Connectives
因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。T-A共同候选教师 -8.661
AI +1.247
T-A -9.908
p=0.105
教师 -7.107
AI -1.793
T-A -5.314
p=0.441
小作文 +3.667
大作文 +5.782
Shared p=0.022
Task p=0.824
教师与AI在因果连接变化上方向一致地分化教师组相对 AI 组在两个体裁中都更偏下降,但两个体裁内的 Teacher-AI 计划对比都未达显著;可作为 AI 主线候选,不能写成强确认结论。
CRFAO1
Referential cohesion
相邻句论元重叠;反映一个句子到下一个句子是否延续相同人物、对象或核心论元。T-A共同候选教师 +0.063
AI -0.027
T-A +0.090
p=0.114
教师 +0.043
AI -0.084
T-A +0.127
p=0.131
小作文 +0.039
大作文 +0.033
Shared p=0.062
Task p=0.865
教师与AI在指称衔接方向上分化教师组相对 AI 组在两个体裁中都更偏上升,方向一致但 p 值只是趋势附近;适合做 Teacher-AI 共同候选,不宜单独主扛。
CNCLogic
Connectives
逻辑连接词密度;反映推理、条件、转折等逻辑关系的显性标记。T-A弱候选教师 +2.107
AI -1.989
T-A +4.096
p=0.525
教师 +4.648
AI -1.528
T-A +6.176
p=0.399
小作文 +2.998
大作文 +3.280
Shared p=0.481
Task p=0.966
逻辑连接资源方向一致但证据弱教师组相对 AI 组在两个体裁中都更偏上升,但计划对比 p 值较弱;只能描述,不宜主写。
CRFCWO1
Referential cohesion
相邻句内容词重叠;反映相邻句是否复用关键实词来维持局部衔接。T-A弱候选教师 +0.010
AI -0.002
T-A +0.012
p=0.364
教师 -0.002
AI -0.033
T-A +0.031
p=0.133
小作文 +0.010
大作文 +0.006
Shared p=0.075
Task p=0.519
相邻句指称衔接弱线索Teacher-AI 方向在两个体裁一致,但数值和统计力度都弱;只放表格,不进入主故事。
CRFNOa
Referential cohesion
全文范围名词重叠;反映跨句名词重复带来的整体指称衔接。T-A弱候选教师 +0.025
AI +0.011
T-A +0.014
p=0.641
教师 +0.064
AI +0.005
T-A +0.059
p=0.406
小作文 +0.024
大作文 +0.032
未进入 10 指标 task 模型全文名词重叠方向一致但证据弱Teacher-AI 方向一致,但两个体裁内计划对比都较弱;只作为完整扫描透明信息。
LSASS1
Semantic overlap (LSA)
相邻句 LSA 语义相似度;反映句子之间概念内容是否接近。T-A弱候选教师 +0.019
AI -0.002
T-A +0.020
p=0.293
教师 +0.000
AI -0.014
T-A +0.014
p=0.489
小作文 +0.024
大作文 -0.005
Shared p=0.337
Task p=0.824
语义重叠弱线索Teacher-AI 方向一致,但两个体裁 p 值都弱;只能作为低优先级线索。
CNCAdd
Connectives
添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。任务调节AI差异教师 +1.818
AI +0.913
T-A +0.905
p=0.884
教师 +11.133
AI -3.422
T-A +14.555
p=0.028
小作文 +9.957
大作文 -3.486
Shared p=0.247
Task p=0.035
添加连接词的 Teacher-AI 差异主要出现在大作文Teacher-AI 方向一致,但大作文显著、小作文几乎没有差异,且 Task 调节显著;它说明 AI/教师差异受体裁影响。
LSASSp
Semantic overlap (LSA)
相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。单体裁AI差异教师 +0.044
AI -0.015
T-A +0.058
p=0.041
教师 +0.002
AI +0.005
T-A -0.003
p=0.841
小作文 +0.022
大作文 -0.010
Shared p=0.182
Task p=0.112
语义相似度只在小作文区分教师与AI小作文 Teacher-AI 计划对比显著,但大作文方向反转且不显著;可写成小作文机制线索,不能写成跨体裁 AI 结论。
CNCADC
Connectives
连接词密度中的扩展/类别化连接资源指标,用来观察显性衔接标记是否整体变化。不适合AI主线教师 +0.932
AI +3.573
T-A -2.640
p=0.440
教师 +4.575
AI +0.397
T-A +4.178
p=0.251
小作文 -0.357
大作文 +0.235
未进入 10 指标 task 模型扩展连接资源方向不一致Teacher-AI 方向在两个体裁不一致,且两个体裁内计划对比都不显著;不进入 AI 主线。
LSAGN
Semantic overlap (LSA)
语义 given-new 重叠;反映新句子与前文共享概念的程度。不适合AI主线教师 -0.002
AI -0.004
T-A +0.002
p=0.861
教师 +0.016
AI +0.021
T-A -0.004
p=0.818
小作文 +0.006
大作文 +0.007
Shared p=0.987
Task p=0.511
全局语义重叠不稳定Teacher-AI 方向在两个体裁不一致,统计证据也弱;不进入 AI 主线。
CNCAll
Connectives
所有连接词总密度;反映显性连接标记总体使用,但太粗,不能单独说明高质量连贯。不适合AI主线教师 -1.760
AI +2.514
T-A -4.274
p=0.625
教师 +8.572
AI -2.619
T-A +11.191
p=0.265
小作文 +15.136
大作文 -1.344
Shared p=0.554
Task p=0.123
总连接词不适合做主指标Teacher-AI 方向在两个体裁相反;总连接词太粗,不适合支撑 AI 相关统一故事。
CNCTemp
Connectives
时间连接词密度,例如 then、after、when;反映事件时间顺序的显性组织。T-A弱候选教师 +2.574
AI +1.403
T-A +1.171
p=0.750
教师 +0.897
AI -5.611
T-A +6.508
p=0.185
小作文 +2.247
大作文 -1.350
Shared p=0.447
Task p=0.663
时间连接词方向一致但证据弱Teacher-AI 方向一致,但两个体裁内计划对比不显著;最多作为描述性补充。
展开:小作文主线关键证据
指标故事角色指标含义Time×Group p最强组内变化组变化值组内 p计划对比 p
SMCAUSvp教师面批与高层因果/情境模型变化情境模型中的因果动词短语连贯指标;反映更高层事件因果链条的组织。0.006Teacher-10.5520.0310.005
SMCAUSv教师面批与高层因果/情境模型变化情境模型中的因果动词/事件连贯指标;反映文本事件因果组织的变化。0.017Teacher-6.9470.0630.011
SMCAUSwn教师面批与高层因果/情境模型变化基于词网语义关系的因果连贯指标;反映事件因果关系是否在语义层面更连贯。0.021No_Feedback+0.0430.0220.006
CNCCaus显性因果连接资源下降/重组因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。0.095Teacher-8.6610.0460.045
LSASSp语义整合辅助证据相邻段落 LSA 语义相似度;反映段落之间概念内容是否连贯或重复。0.106Teacher+0.0440.0300.041
CNCAdd添加连接词的任务边界添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。0.263No_Feedback+9.9570.0250.146
DRINFAI/局部语言摄取辅助线索不定式/动词形式相关密度;反映局部句法和动词短语资源变化。0.072AI-7.5870.0080.047
WRDPOLcAI/局部语言摄取辅助线索词汇极性/情感取向相关指标;反映词语情感色彩或极性变化。<.001Teacher-0.357<.001<.001

Method Appendix

统计和质控只放这里

二次建模可以保留,但它不是研究问题。建议在 Method/Data analysis 或补充材料中写成敏感性分析:先用完整 LMM 标记 |standardized residual| > 2.5 的观测,再用同一模型重拟合。

任务指标指标含义剔除观测数完整模型 p二次模型 p
小作文/应用文CNCCaus因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。20.0950.025
大作文/读后续写CNCCaus因果连接词密度,例如 because、so、therefore;反映学生是否显性标记因果关系。30.1590.424
大作文/读后续写CNCAdd添加/并列连接词密度,例如 and、also、moreover;反映表层追加信息的衔接方式。20.0350.021

数据路径附录

DataAnalyze/output/tables/13_metric_dictionary.csv

DataAnalyze/output/tables/24_lmm_metric_summary_all_metrics.csv

DataAnalyze/output/tables/26_lmm_planned_change_contrasts_all_metrics.csv

DataAnalyze/output/tables/27_lmm_estimated_within_group_changes_all_metrics.csv

DataAnalyze/output/tables/30_continuation_lmm_metric_summary.csv

DataAnalyze/output/tables/31_continuation_lmm_within_group_changes.csv

DataAnalyze/output/tables/32_continuation_lmm_planned_contrasts.csv

DataAnalyze/output/tables/34_task_alignment_overlap_metrics.csv

DataAnalyze/output/tables/28_storyline_lmm_audit.csv

DataAnalyze/output/tables/35_outlier_sensitivity_lmm.csv

DataAnalyze/data/01_practical_writing_小作文_应用文/03_analysis_ready_整理表/practical_data.csv

DataAnalyze/data/02_continuation_writing_大作文_读后续写/03_analysis_ready_整理表/continuation_data.csv

脚本路径附录

DataAnalyze/script/build_theory_storyline_rq_report.py

DataAnalyze/script/compare_task_lmm_alignment.R

DataAnalyze/script/audit_storyline_lmm.R

DataAnalyze/script/outlier_sensitivity_lmm.R

报告边界

当前是给老师讨论主线和 RQ 的报告,不是最终 Results。最终写作还需要回到学生原文补文本例证,尤其解释 CNCCaus 下降的质量意义。