基于计算机的动态评估在二语习得领域的研究综述

杨安琪

山东师范大学 250014

摘要

国内针对动态评估的研究领域已经逐渐从心理学转向应用语言学，相比于传统的静态评估，动态评估为二语习得研究提供了新的视角。本文以维果茨基的社会文化理论为基础，梳理动态评估在二语习得领域的研究现状，探讨基于计算机的动态评估在二语习得领域的应用现状和发展前景，最后探索当前计算机化动态评估在汉语二语习得领域面临的机遇和挑战。

关键词

动态评估；二语习得；计算机

正文

一、引言

动态评估不仅是一种语言评估方法，更是一种“以发展为导向的”的教学理念，其打破了传统语言评估模式所存在的“评估”与“教学”相割裂的困境。基于维果茨基的社会文化理论理论的动态评估则主张通过中介互动实现“评估”与“教学”相结合的目的。目前传统一对一互动的动态评估方式存在着两大局限：一是人工成本高且效率低；二是中介者存在个体差异，导致难以实现标准化评估。而计算机化动态评估则能将动态评估标准化且规模化，突破传统一对一互动的局限，最终实现高效的教评一体化的教学体系。

二、动态评估理论概述

（一）理论基础

动态评估（Dynamic Assessment，简称DA)又称学习潜能评价(Learning Potential Assessment)，起源于近四五十年的西方，是在评价过程中探索和发现学习者潜在发展能力的一种新型交互式评估理论，涉及到评价者和学习者双方，前者尤指有经验的评价者。

动态评估的理论基础源于前苏联心理学家维果茨基（Vygostky）的社会文化理论，其作为教育心理学领域的重要理论之一强调了社会互动在个体发展中的重要性，突出了语言在心理发展中的中介作用。而最近发展区 (Zone of Proximal Development，简称 ZPD）理论作为社会文化理论的重要组成部分，则更为细化地揭示了个体在特定的社会文化环境中如何逐步实现从潜在能力到实际能力的转化，在转化过程中个体与他人进行的互动与合作起到了至关重要的作用，进而为DA的具体实施路径提供了更为具体的策略和方法。

（二）评估模式

动态评估在发展中逐渐形成了干预主义（Intervention-ist）和互动主义（Interactionist）两大流派，众多研究均围绕互动式和干预式这两种模式展开：互动式关注评估者与学习者的互动，注重学习者的心理发展潜能与质性评估；干预式分为“三明治式”和“蛋糕式”两类，更注重学习的速度和效率。从评估流程来看，“三明治式”分为前测、干预、后测三个部分，流程固定且各个阶段相对独立；“蛋糕式”则无明显独立的前测和后测阶段，它的干预是即时的，测验项目对应着蛋糕，评估者给出的提示对应着蛋糕表层涂抹的奶油。从测评结果来看，“蛋糕式”更个性化的干预过程有助于生成更个性化的测评结果。

三、动态评估的理论研究概述

就效度问题而言，动态评估的效度问题长期受传统心理测量学质疑，其质疑的核心问题在于能力测量的“动态性”与传统“静态性”两者之间的冲突，Poehner（2018）提出了微效度（Micro Validity）与宏效度（Macro Validity）框架，重新定义DA中的有效性验证逻辑，解决了传统评估对“动态性”的解释困境，但依然未建立标准化的效度指标。Poehner（2011）基于维果茨基的ZPD理论，引入效度理论，并结合Messick的多维度模型，探讨了动态调节中“微观效度”与“宏观效度”的构建。

就适用群体范围而言，Poehner（2017）从辩证逻辑的角度深度分析了维果茨基最近发展区理论在教育中作为“教学与评估双极”的内涵，理清了动态评估（DA）与中介发展（MA）的哲学基础，并提出ZPD活动需将两者结合。同年Poehner反驳了Kellogg对ZPD的狭义解读，后者认为ZPD仅适用于儿童个体发生，成人二语学习不属于发展，前者则强调了其跨年龄适用性，为成人二语习得研究奠定了理论基础。

四、计算机化动态评估概述

计算机动态评估（Computerized Dynamic Assessment，简称C-DA），它近似于动态评估的互动方法，可以帮助学生在第二语言学习中更好地了解自己的学习潜能，也可以作为诊断和评估工具。动态评估（DA）是一种可行的第二语言或外语语境诊断工具，计算机动态评估（C-DA）则被建议作为与DA程序相关的实用性问题的解决方案。

在动态评估理论实施的过程中，较低的教师学生数量比催生了一系列的科技辅助工具，先进的数字信息科技与动态评估相结合已成为当前动态评估应用的发展趋势，形成了移动动态评估（Mobile-Based Dynamic Assessment）和计算机动态评估（Computerized Dynamic Assessment，C-DA）两种科技辅助手段。

前者的显著特征是移动终端交流互动软件的使用，Rezaee（2019）研究了在口语动态评估中使用移动设备辅助的影响，证实了移动动态评估在口语教学中的有效性，研究中被试使用Whats App软件，和计算机网页的区别在于，它在电脑和手机上都可下载且运行稳定，功能类似于中国的微信。之后Andujar（2020）也同样使用Whats App工具探索了移动动态评估对外语学习者的语言水平影响。后者与移动动态评估相比，研究出现更早且更多。

五、计算机化动态评估的应用研究概述

随着AI和大数据的发展，将计算机动态评估运用于语言学习的动态评估中是一种紧跟时代的研究，将评估主体由教师转变为计算机，也进一步解决了传统的一对一互动人工成本高且效率低和难以实现标准化评估这两大难题。

（一）计算机化动态评估在国外二语领域的应用

Poehner（2013）在分析动态评估理论基础的同时，通过实证研究比较了干预型和互动型两种不同的评估模式，并介绍了计算机化动态评估的开发与试点，在中法俄语言学习者中进行了计算机阅读和听力的评估试点。Poehner，Xiaofei Lu & Jie Zhang（2015）对计算机化动态评估的探索十分严谨，首先通过预试验优化题目难度，随后对6名汉语学习者进行一对一的动态评估，将提示菜单标准化，最后对68名汉语听力学习者和82名汉语阅读学习者进行计算机化测试。此研究利用计算机化动态评估将DA标准化且规模化，弥补了传统评估在精准诊断和教学衔接方面存在的不足。Poehner&Leontjev（2018）利用计算机化动态评估对25名爱沙尼亚的英语学习者进行了标准化测试，为计算机化评估设计提供了可参考的提示层级模板，由“重新思考”到“明确解释”。

从2020年至今，国外基于计算机动态评估的语言学习方面的研究比较多，像是掀起了一股小的时代热潮，比如RANDALL（2020）进行了第二语言发展中的计算机动态评估研究，在以西班牙语作为外语的课堂上，研究分析C-DA的使用是否有助于培养学生使用西班牙语动词将来时态的能力。Masoomeh Estaji和Fatemeh Safari在同一年研究了计算机动态评价对伊朗英语学习者听听力时工作记忆广度的影响，考察被试听力理解成绩的变化是否可能是C-DA和工作记忆相互作用的结果。

总体来看，国外早期研究更多关注计算机动态评估对学生能力提升的有效性和可操作性，后期研究更多关注将计算机动态评估与动态评估其他方面的结合与对比。

（二）计算机化动态评估在国内二语领域的应用

近年来，国内也有教师注意到动态评估的优势并将其应用到课堂教学中，多在英语作为外语的教学中，关于动态评估的研究涉及教育、心理学、特殊群体等领域，也有细化到写作、口语和听力技能的动态评估（张艳红，2008；韩宝成，2009；李奕华，2015；孟亚茹等，2019；刘鸿颖、刘芹，2020；罗娟，2020），但是计算机化动态评估在国内二语领域的应用研究十分稀缺。

高思畅&王建勤（2018）在理论层面提出了“计算机辅助”和“群体ZPD”等创新模式，这种前言的理论探索为国内的汉语二语评估提供了新的思路，同时也呼应了当今数智时代下的教育技术发展。贾琳&王建勤（2021）提出的可操作的调节等级量表和孙志君，许芃&王建勤（2021）提出的新的学习潜力分数（LPS）公式，在为课堂互动提供标准化工具的同时也为未来计算机动态评估的标准化以及规模化奠定了基础。

相比之下，国内有关的C-DA实证研究更是少之又少，研究对象大多都是英语学习者，目前所了解到的只有中国海洋大学做了此方面的研究，进行了评估系统的开发和试验程序的准备，通过计算机动态评估诊断中国英语学习者的语用表现，从而预测考生未来发展和提高其语用方面的有效性，最后通过干预之后的数据，得出了计算机动态评估的诊断和干预效果优于传统的评估的实验结论。这一研究也为C-DA在汉语二语测试方面提供了研究基础，可初步进行汉语阅读、汉语听力等方面的研究。

从上述相关动态评估的实证研究来看，国外在C-DA方面的发展和研究较早，在二语阅读、写作、听力等方面都有涉猎，且已有了系列成果。国内的动态评估研究起步较晚，目前主要集中在动态评估在外语教学中的应用研究，写作方面的研究文献比较多，但是C-DA的研究甚少，在汉语二语习得领域的应用方面几乎是零研究。但随着人工智能（AI）技术的不断发展与完善，大语言模型作为其产物可以作为相当前沿且高效的科技辅助工具，同时有助于弥补二语习得口语研究领域的空白。举个例子，就动态提示系统的开发而言，可以利用AI驱动，结合实时互动数据调整中介策略，兼顾标准化与个性化，如多邻国的AI聊天机器人，能够进行口语的互动式修正。

六、结语

尽管计算机化评估等科技辅助工具在二语习得领域的研究仍处于初级探索阶段，国内与之相关的实证性研究甚少，但是这种标准化、规模化的动态评估方式为汉语等二语习得领域提供了新的研究视角。随着AI技术的进一步发展与完善，其作为科技辅助工具的优势和使用趋势将会越来越明显。目前国家政策的支持以及国际趋势的推动使得来华留学生的数量持续增长，在研究对象方面进一步支持和推动了计算机动态评估在汉语二语习得方面的实证研究。未来推动C-DA与国际中文教育的深度融合具有重要的理论和实践意义，在开展实证研究的同时，也要注重加强教师在C-DA理解和应用方面的培训，从而确保C-DA能够在汉语二语教学实践中得到有效实施。

参考文献

[1] Poehner, M. E., & Van Compernolle, R. A. (2018). Interaction, change, and the role of the historical in validation: The case of L2 dynamic assessment. Journal of Cognitive Education and Psychology, 17(1), 28-46.

[2] Poehner, M. E. (2011). Validity and interaction in the ZPD: Interpreting learner development through L2 dynamic assessment. International Journal of Applied Linguistics, 21(2), 244-263.

[3] Poehner, M. E. (2017). The zone of proximal development and the twin poles of teaching and assessing in Vygotsky’s developmental education. Creative dimensions of teaching and learning in the 21st century, 151-161.

[4] Rezaee, A. A., Alavi, S. M., & Razzaghifard, P. (2019). The impact of mobile-based dynamic assessment on improving EFL oral accuracy. Education and information technologies, 24, 3091-3105.

[5] Andujar, A. (2020). Mobile-mediated dynamic assessment: A new perspective for second language development. ReCALL, 32(2), 178-194.

[6] Poehner, M. E., & Lantolf, J. P. (2013). Bringing the ZPD into the equation: Capturing L2 development during computerized dynamic assessment (C-DA). Language Teaching Research, 17(3), 323-342.

[7] Poehner, M. E., Zhang, J., & Lu, X. (2015). Computerized dynamic assessment (C-DA): Diagnosing L2 development according to learner responsiveness to mediation. Language testing, 32(3), 337-357.

[8] Poehner, M. E., & Leontjev, D. (2020). To correct or to cooperate: Mediational processes and L2 development. Language Teaching Research, 24(3), 295-316.

[9] Randall, T. S. (2020). Computerized dynamic assessment of grammar in second language development. University of Massachusetts Boston.

[10] Estaji, M., & Safari, F. (2020). The effect of computerized dynamic assessment on working memory span of EFL learners while listening. Journal of Asia TEFL, 17(3), 1132.

项目名称：智能驱“动”，乐学汉语——基于“互联网+”的计算机辅助汉语二语学习潜能动态评估研究及应用

项目编号：S202410445313

...

阅读全文