Summary
本文介绍如何实施一个简单的词法决策实验,以评估神经健康参与者以及痴呆症和认知衰退患者的书面单词识别度。我们还使用主要成分分析 (PCA) 和混合效应建模提供了反应时间分析的详细说明。
Abstract
老年人比年轻人识别视觉物体的速度要慢。识别字母字符串是真实单词的情况也是如此。患有阿尔茨海默氏病(AD)或轻度认知障碍(MCI)的人,在书面单词识别中表现出比老年人对照组更长的反应。尽管在衰老和神经认知障碍中识别速度普遍较慢,但无论年龄或神经病理学如何,单词的某些特征都会影响单词识别速度(例如,单词的使用频率)。我们在这里提出了一个协议,用于检查词汇特征对单词识别响应时间的影响,在一个简单的词汇决策实验中,对年轻和老年人以及MCI或AD患者进行管理。在本实验中,要求参与者尽可能快速准确地决定给定的字母字符串是否是实际单词。我们还描述了混合效应模型和主要组件分析,可用于检测不同类型的词汇变量或参与者的个体特征对单词识别速度的影响。
Introduction
单词存储在高度互联的网络的心理词典中。单词之间的连接可能反映共享属性,如语义相似性(例如,狗和猫),形成相似性(狗和雾),或常见语言使用中频繁发生(例如,狗和猫)勒什)。语言的认知理论,如基于用法的理论1,认为语言使用者每次遇到一个词都会对单词的心理表现产生影响。根据 Exemplar 理论,单词的表示由许多范例组成,这些范例由语言使用的各个标记建立而成,表示给定类别存在的可变性。使用频率 2通过增强范例1的强度来影响内存中的表示。
词识别速度可以揭示心理词汇的特点。衡量单词识别速度的常用实验范式是词汇决策任务。在此任务中,在监视器上向参与者显示字母字符串,一次一个。他们被指示通过按下相应的按钮,尽快决定屏幕上的字母字符串是否是真字。
通过检查真实单词的反应时间,研究人员可以解决许多有关语言处理的重要问题。例如,确定哪些因素使识别速度更快,可以检验关于心理词典结构的假设,并揭示其结构。此外,对不同参与者群体的表现进行比较可以帮助我们理解各种语言体验的影响,或者,在衰老或神经退行性疾病(如阿尔茨海默氏病)的情况下,认知的作用下降。
某些因素(例如使用频率)对单词识别的影响大于其他因素(例如,单词长度)。随着年龄的增长,人们识别书面文字的方式可能会改变3,4。年轻人往往严重依赖一个词的语义(基于意义)方面,例如有多少化合物(例如,牛头犬)或派生词(例如,狗)与目标词(在本例中为狗)共享形式和含义的方面。老年人的单词识别似乎更受基于表单的方面的影响,例如两个后续字母在语言中共同出现的频率(例如,字母组合在英语单词中出现的频率比组合语更频繁)斯克)
为了确定影响不同组单词识别速度的因素,研究人员可以操纵刺激集中的某些变量,然后测试这些变量预测单词识别速度的能力。例如,为了测试单词识别是由语义因素还是基于表单的因素驱动,刺激集应包括反映单词与心理词典中语义邻居的连接程度或与其他单词的连接性的变量共享其部分形式。
该方法在目前的研究中用于研究单词识别速度是否受年轻人和老年人以及患有阿尔茨海默氏病(AD)或轻度认知障碍(MCI)3的人的不同因素的影响。此处描述的方法基于视觉单词识别,但可以适应听觉模式。但是,在典型的视觉词汇决策实验中,一些变量是反应时间的重要预测器,它们可能无法预测听觉词词决策中的响应延迟,或者可能具有相反的效果。例如,语音邻域在这两种模式中具有相反的效果 5:具有较大语音邻域的单词对视觉单词识别具有促进作用,但会导致在听觉词汇决定6。
老年人的寻字困难通常归因于难以访问语音词的形式,而不是语义表示8的细目。然而,AD研究主要集中于语义衰退9,10,11,12,13,14。重要的是解开语义和正交因素如何影响在衰老中识别文字,有认知衰退,没有认知衰退。与形式相关的因素的影响在老年人中比在年轻人中更为明显,在MCI或AD3患者中仍然显著。因此,这种方法可以帮助我们发现不同人群的精神词典的特征,并识别词典组织随年龄和神经病理学而变化。在测试神经病理学患者时,一个顾虑是他们可能难以获得与任务相关的知识。然而,词汇决策任务是一个简单的任务,没有负担的工作记忆或其他复杂的认知技能,许多患者表现出问题。它被认为适合AD和MCI人群。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
该议定书遵循北萨沃医院区道德委员会(IRB00006251)的指导方针。
1. 参与者筛选
- 招募视力正常或矫正、以语言为母语的年轻和老年人,除非该研究涉及有关第二语言习得的特定研究问题。
- 对于健康对照组,不包括有神经或精神疾病史的参与者。
- 对于临床组,招募被诊断患有阿尔茨海默氏症15或轻度认知障碍16,17的个人。根据临床医生的判断,只招募能够给予知情同意的个人。为了进行准确的比较,将临床组的年龄范围和平均值与健康的老年成人参与者的年龄范围和平均值相匹配。
- 例如,使用临床痴呆等级表 18(CDR,0=无痴呆,0.5=非常温和、1=轻度、2=中度、3=严重)测量痴呆症的严重程度。排除严重痴呆症患者,因为任务对他们来说可能太难了。不包括似乎无法遵循说明的参与者,尽管他们的严重程度评级。
2. 刺激结构
- 选择词刺激来解决特定的研究问题,例如,语义或正交/音谱变量对不同人群的单词识别19有更强烈的影响。
- 从 20号语料库中计算或从数据库中检索21个变量,这些变量反映了刺激的语义、语音和正交特征,因此可以用作理论激励的预测变量来解释单词识别反应时间或作为控制变量。此外,使用参与者的性别、年龄和受教育年数作为解释或控制变量。
- 除了真实单词之外,还构建一组匹配的伪词。伪词与真实词相似,因为它们符合语言规范,将某些字母放置在某些单词位置(声乐)。为了控制声乐,创建伪词,例如,通过随机将某些单词中的第一个音节与其他单词的第二个音节重新组合。删除通过此重组生成真实单词的所有项目以及违反语言的声乐的所有项目。
- 将伪单词与目标单词按字母长度和大写频率进行匹配,这是文本语料库中两个后续字母的所有组合发生的平均次数。这些变量已被证明会影响识别速度。
注:操纵伪字比率(例如,真实单词的数量相对于伪单词的数量)可能会导致不同的结果,对不太可能的刺激的反应较慢,更不准确22。 - 添加一组真实词填充器,以减少参与者对属于某一类型(例如,特定拐点类)的下一个刺激的期望值。例如,从不同的词类(例如,变形类)中选择它们,而不是根据兴趣特征构建刺激的词类。
3. 实验设计
- 水平呈现字母字符串,一次一个,转用大约 5° 的视角。
- 从包含少量试验的实践单元开始实验,每个试验显示一个单词(例如,15 个单词和 15 个未包含在实际实验中的伪单词)。这是为了让参与者熟悉任务和响应按钮。如果学员在练习试验期间没有准确响应(真实单词的"是"按钮和伪单词的"否"按钮),请提供反馈并重做练习单元。
- 将实验分成多个块,并在练习课后和块之间提供短暂的休息时间。这些休息允许参与者休息的眼睛,将减少疲劳。
- 启动每个新块与几个填充项目,将不包括在分析(例如,常见的名词,如狗,妹妹,年),因为块的前几个试验有时忽略与MCI或AD的参与者。
- 以随机顺序为每个参与者显示实验项目。
- 从每个试验开始时,屏幕中央会显示一个固定标记(例如 + 符号),显示 500 ms,然后是固定(例如 500 ms)的空白屏幕或可变时间量(例如 500-800 ms)。
- 紧接空白屏幕后,立即显示 1,500 ms 的字母字符串(单词或伪字),或直到参与者响应。
- 在单词开始或从单词开始 1,500 毫秒后(以先到者为准)做出响应后,再次使用空白屏幕进行操作,直到从试用开始 3000 毫秒通过。
- 重复此序列,直到呈现实验中的所有项。
注:刺激之间的延迟时间作为示例。更改它们可能会影响结果模式。
4. 实验程序
- 将学员放在计算机显示器前,在通常照明的室内观看距离约为 80 厘米。
- 指示学员通过用其主导手按两个对应按钮之一(例如,真字的食指和中指),尽可能快速、准确地决定屏幕上的字母字符串是否是真字。伪字)或使用每只手的食指。
注:学员尝试根据说明优化其性能。因此,他们的反应将受到强调速度超过准确性的影响,反之亦然23。
5. 在 R 中使用混合效果模型分析数据
注: 可以使用许多不同的统计程序来执行分析。本节介绍在 R24中分析数据的步骤。
- 从演示程序的输出文件中获取每个试验的反应时间 (RT)(以毫秒为单位)(例如,E-Studio 软件)。
- 安装软件包lme428和lmerTest29。将包与函数库或要求连接。
- 使用read.table函数将数据导入 R。
- 检查转换的需要,例如,使用MASS封装25中的boxcox函数,因为 RT 数据的分布通常高度偏斜。
>库 (MASS)
> boxcox(RT = Exp_变量,数据 = 您的数据)
注: boxcox函数生成的图形显示了 boxcox 变换参数的 95% 置信区间。根据位于此间隔内的 lambda 值,可以选择所需的变换,例如 ,+=1(反向变换)、±0(对数变换)、^1/2(平方根变换)和 +1/3(多维数据集根转换)。- 使用反向转换的 RT 值(例如 -1000/RT)或 RT 的二进制对数(例如 log2(RT)))转换 RT 值,因为这些转换往往比原始 RT在词法决策实验中为反应时间提供更正态的分布26.
- 或者,使用不依赖于正态分布和拟合强健的线性混合效应模型的统计方法,并提供离群值或其他污染源对异常值或其他污染源影响不大的估计值27。
- 由于反应时间分析通常针对准确的反应进行,因此不包括参与者反应不正确的试验(对真实词语的"否"响应)和遗漏。
- 此外,排除对伪单词和填充物的响应,除非有关于伪单词和填充物的特定假设。
- 排除响应时间超过 300 ms 的试验,因为它们通常表明参与者对以前的刺激反应为时已晚,或者他或她在阅读刺激之前意外按下响应按钮。
- 构建一个基本的线性混合效果模型,将RT标识为结果度量,将主题、项目和试验标识为随机效果。请注意,其值从较大的值集(总体)中随机采样的变量作为随机效果和具有少量级别的变量或数据中包含所有级别都是固定效果的变量。在窗体中添加随机效果(1 |主题)以估计每个随机效果的随机截距。
> g1 = lmer (RT = (1 |主题) * (1 |项目) = (1 |试用)、数据 + 数据)
> 摘要 (g1) - 按理论动机的顺序添加解释变量。例如,将单词的基本频率添加为固定效果。某些变量(如基数或表面频率)具有 Zipfian 分布,因此将它们插入模型中,具有生成更高斯分布形状的变换,例如对数变换。
> g2 = lmer (RT = 日志 (基频率 = 1) = (1 |主题) * (1 |项目) = (1 |试用)、数据 + 数据)
> 摘要 (g2) - 与没有预测变量的模型相比,使用Anova函数检查添加每个预测变量(例如BaseFrequency)是否显著提高了模型的预测能力。
> anova (g1, g2)- 如果新模型的拟合与较简单的模型没有显著差异,则首选预测变量较少的最简单的模型。此外,请检查每个模型的 Akaike 信息标准 (AIC)30。AIC 是衡量统计模型根据最大可能性拟合一组数据的一致程度。值越低,表示更适合数据31。
> AIC (g1);AIC (g2)
- 如果新模型的拟合与较简单的模型没有显著差异,则首选预测变量较少的最简单的模型。此外,请检查每个模型的 Akaike 信息标准 (AIC)30。AIC 是衡量统计模型根据最大可能性拟合一组数据的一致程度。值越低,表示更适合数据31。
- 重复步骤 5.7。和5.8。通过添加其他解释变量,例如,表1中介绍的一些变量,按理论上激励的顺序逐一排列,并只保留那些显著提高模型预测能力的变量。如果使用可变刺激开始异步,请将其作为固定效应变量包含在模型中。
- 检查预测变量之间的理论动机相互作用。例如,按年龄添加交互词"基本频率"的日志。
> g3 = lmer (RT = 日志(基频率 = 1) = 年龄 = 日志(基频率 = 1) : 年龄 = (1 |主题) * (1 |项目) = (1 |试用)、数据 + 数据)
注: 预测变量可能作为与另一个变量的交互项很重要,但作为主预测变量则不重要。在这种情况下,不要从模型中删除此预测变量(也将其作为主要效果包括)。 - 通过添加变量名称前的"1 +"来为预测变量添加按参与者随机斜率32,然后"*主题",例如, (1 + 日志)基频率 + 1) |主题),因为参与者的响应时间可能以不同的方式受到单词词汇特征的影响。
注:如果有许多连续预测变量,则允许它们全部具有随机斜率是不现实的,因为随机坡度模型需要大量的数据来准确估计方差和协方差33、34。如果最大模型不收敛(换句话说,成功计算),则简化模型33。或者,实现贝叶斯版本的多级建模35。 - 分别运行每个参与者组的分析。或者,对所有数据运行分析,将组作为固定效应预测变量,然后测试重要预测变量的组交互。
> g4 = lmer (RT = 日志 (基频率 + 1) • 年龄 + 日志 (基频率 + 1) : 年龄 + 组 + 日志 (BaseFrequency = 1) : 组 = (1 + 日志 (BaseFrequency = 1) |主题) * (1 |项目) = (1 |试用)、数据 + 数据) - 为了消除可能的离群值的影响,排除绝对标准化残差超过的数据点,例如 2.5 标准差26,并将模型重新与新数据(yourdata2) 重新拟合。
> 您的数据2 = 您的数据 [abs(比例(量程)))))]< 2.5, |
> g5 = lmer (RT = 日志 (基频率 + 1) • 年龄 + 日志 (基频率 + 1) : 年龄 + 组 + 日志 (BaseFrequency = 1) : 组 = (1 + 日志 (BaseFrequency +1) |主题) * (1 |项目) = (1 |试用)、数据 = 数据2)
注: 并非所有极端数据点都对模型有害,只有那些对模型有过度杠杆作用的数据点。 - 在探索性(数据驱动)分析的情况下,使用向后逐步回归:在初始分析中包括所有变量,然后以分步方式从模型中删除非显著变量。或者,使用包lmerTest29提供的步长函数消除非显著预测变量的自动过程。
>步骤 (g4)
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
表 1显示了从三个不同的源(语料库、字典和测试项的试验测试)获取的变量的列表,这些变量作为固定效应预测变量包含在分析中。这些变量中有许多以前报告会影响单词识别速度。
语料库: | |
基本频率 | 单词以各种形式出现在语料库中的次数(例如,儿童和儿童) |
比格拉姆频率 | 两个后续字母的所有组合在语料库中出现的平均次数 |
形态家族大小 | 与名词共享的派生词和复合词的数量 |
形态家族频率 | 所有形态族成员的汇总基本频率 |
伪形态族大小 | 不仅包括"真"形态学的家庭成员,还包括模仿形态家庭成员的正交形式,无论它们是否是实际形态,因此表示正交重叠,但不一定是语义重叠的词语 |
伪形态家族频率 | 所有伪形态族成员的汇总基本频率 |
表面频率 | 单词以完全相同的形式出现在语料库中的次数(例如子语)。 |
三元频率 | 三个后续字母的所有组合在语料库中出现的平均次数 |
字典: | |
哈明距离一 | 相同长度但仅在任何单一字母中不同的单词数36 |
长度 | 字母数 |
正交邻域密度 | 长度相同但仅在首字母37,38中不同的单词数 |
试验测试: | 16名与会者以6分制(从0到5)表示对以下参数上每个目标词的估计值。 |
作为适当的名称 | 这个词多久被视为一个适当的名称(例如,作为一个姓氏,如贝克)39 |
具体 | 词语所指的具体实体的直接性40 |
熟悉度评级 | 这个词有多熟悉 |
可成像性 | 语言产生心理图像的轻松和速度40 |
表 1.混合效应分析中包含的变量作为固定效应预测变量,从三个不同的源(语料库、字典和测试项的试验测试)获取。
解释变量的数量可以更小或更大,具体取决于研究问题和数据库、字典或公司变量的可用性。但是,将大量词法特征作为预测变量可能会导致预测变量之间共线性形式的并发症,当预测变量相互关联,从而对结果度量产生类似影响时。例如,单词的具体性和可图像性可能高度相关。任何线性回归分析的假设是预测变量彼此独立。但是,随着模型中添加更多变量,某些变量彼此不独立的风险增加。变量之间的相关性越高,这种共线性对模型41的危害就越大。共线性的一个潜在后果是,某些预测变量的显著性水平可能是虚假的。
为了避免预测变量之间的共线性效应,应减少预测变量的数量。如果两个预测变量显示共线性,则模型中只应包含其中一个预测变量。但是,如果两个以上预测变量显示共线性,则排除除一个预测变量外的所有预测变量将导致解释的方差损失。一方面,研究人员可能会先验地减少实验设计中已有的解释变量的数量,只留下那些假设驱动(理论动机)且允许研究者检验两者之间的假设。不同的人群。另一方面,有时没有现有的理论,因此,使用主要分量分析 (PCA)41通过将具有类似效果的预测变量合并到组件中来减少预测变量的数量是合理的。在此分析中,预测变量空间被正交,新空间的主要组成部分被用作预测变量(按照此处介绍的步骤,第 118-126 页第41页)。使用 PCA 的一个缺点是,有时组件很难分解多个预测变量的影响;它们可能都出现在同一主体组件上,加载力强。
我们将所有词汇预测变量转换为五个主要组件,以研究单词识别速度对于年轻人和老年人可能如何不同。然而,其中只有两个在年轻人的数据中是显著的(表3:PC1和PC4)。三个主要组件(PC)是老年人对照模型中的重要预测变量(表4)、MCI(表5)和具有AD的个人(表6)。
PC2 | |
比格拉姆·弗雷克 | -0.390 |
哈明距离一 | -0.350 |
最后的三格弗里克。 | -0.330 |
邻里密度 | -0.320 |
长度 | -0.226 |
初始三格法夫。 | -0.224 |
伪家庭大小(最终) | -0.124 |
伪家族 freq.(最终) | -0.052 |
家庭频率(化合物) | -0.042 |
家庭规模(化合物) | -0.039 |
家庭词汇(派生词) | -0.036 |
家庭大小(派生词) | -0.034 |
表面频率。 | -0.023 |
基地freq。 | -0.008 |
伪族大小(初始) | 0.070 |
熟悉度评级 | 0.093 |
作为适当的名称 | 0.102 |
伪家族 freq.(初始) | 0.113 |
具体 | 0.275 |
可成像性 | 0.296 |
伪族大小(内部) | 0.296 |
伪家族 freq.(内部) | 0.316 |
表2.PC2 的旋转矩阵。加载是每个变量对组件的贡献程度。此表已根据 Cortex3的权限进行了修改。
表 2显示了词法变量及其在 PC2 上的载荷。PC2 最强的正载荷是伪族大小和内部位置重叠的频率。最强的负载荷是大拉姆频率、一个汉明距离、最终三分频率和正交邻域密度。由于所有这些变量主要是基于表单的,而不是基于意义的,PC2 被解释为反映了单词基于表单的方面对单词识别速度的影响。
表3显示了年轻人(31名参与者)的混合效应分析结果。由于PC2不是年轻人反应时间的重要预测因素(见表3),这似乎表明,与老年人(包括有AD或MCI的A/A或MCI)相比,这些基于形式变量对年轻人的反应时间的影响较小.
固定效果 | 估计 | 斯特德错误 | t- 值 | p- 值 |
(拦截) | -1.31 | 0.05 | -26.36 | <0.001 |
异态 | -0.034 | 0.015 | -2.3 | 0.024 |
PC1 | -0.021 | 0.004 | -5.179 | <0.001 |
PC4 | -0.042 | 0.008 | -5.224 | <0.001 |
随机效果 | ||||
组 | 名字 | 方差 | 斯特德 | 科尔 |
项目 | (拦截) | 0.009 | 0.095 | |
主题 | (拦截) | 0.032 | 0.179 | |
PC1 | 4.765e-05 | 0.007 | 0.08 | |
残余 | 0.005 | 0.235 | ||
2862人;项目, 99;主题, 31 |
表 3.与响应延迟相拟的混合模型的估计系数、标准误差和 t 和 p 值为年轻人的真实词语而引起。此表已根据 Cortex3的权限进行了修改。
固定效果变量的估计值可以解释为,如果此固定效果的值发生变化,则因变量 (RT) 增加或减少的金额。如果估计值为负数,则表示变量与反应时间呈负相关(变量越高,反应时间越小(越快)。t 值通常应小于 -2 或大于 2,以使预测变量显著。
表4、表5和表6显示了老年人对照组(17名参与者)、MCI患者(24名参与者)和AD个体(21名参与者)的混合效应分析结果。
三个老年人群之间出现了一个有趣的差异:教育显著地预测了老年人控制中的单词识别速度(表4;教育估计为负数,这意味着受教育年数是与更快的反应时间)和与MCI(表5)的个人相关,但不是在有AD的个人(表6;教育从模型中被放弃,因为它不是一个重要的预测者),尽管这些群体在教育年数的可变性上没有明显的差异(AD:平均10.8岁,SD 4.2,范围5-19;MCI:平均10.4年,SD 3.5,范围6-17;老年人控制:平均13.7年,SD 3.7,范围8-20)。
固定效果 | 估计 | 斯特德错误 | t- 值 | p- 值 |
(拦截) | -0.72 | 0.157 | -4.574 | <0.001 |
异态 | -0.022 | 0.01 | -2.14 | 0.035 |
PC1 | -0.011 | 0.003 | -4.122 | <0.001 |
PC2 | -0.011 | 0.005 | -2.223 | 0.029 |
PC4 | -0.02 | 0.006 | -3.687 | <0.001 |
教育 | -0.024 | 0.011 | -2.237 | 0.041 |
随机效果 | ||||
组 | 名字 | 方差 | 斯特德 | |
项目 | (拦截) | 0.003 | 0.057 | |
主题 | (拦截) | 0.026 | 0.16 | |
残余 | 0.033 | 0.181 | ||
1595年;项目, 99;主题, 17 |
表4.与响应延迟拟合的混合模型的估计系数、标准误差和 t 和 p 值,为老年人控件的实际词而引起。此表已根据 Cortex3的权限进行了修改。
固定效果 | 估计 | 斯特德错误 | t- 值 | p- 值 |
(拦截) | -0.562 | 0.114 | -4.922 | <0.001 |
PC1 | -0.009 | 0.003 | -3.218 | 0.002 |
PC2 | -0.013 | 0.005 | -2.643 | 0.01 |
PC4 | -0.018 | 0.006 | -3.078 | 0.003 |
教育 | -0.039 | 0.01 | -3.708 | 0.001 |
随机效果 | ||||
组 | 名字 | 方差 | 斯特德 | |
项目 | (拦截) | 0.003 | 0.056 | |
主题 | (拦截) | 0.03 | 0.174 | |
残余 | 0.061 | 0.248 | ||
2227人;项目, 99;主题, 24 |
表5.对于使用 MCI 的个人来说,与响应延迟拟合的混合模型的估计值系数、标准误差和 t 和 p 值。此表已根据 Cortex3的权限进行了修改。
固定效果 | 估计 | 斯特德错误 | t- 值 | p- 值 |
(拦截) | -0.876 | 0.051 | -17.017 | <0.001 |
异态 | -0.018 | 0.009 | -2.008 | 0.048 |
PC1 | -0.011 | 0.003 | -4.097 | <0.001 |
PC2 | -0.011 | 0.004 | -2.718 | 0.008 |
PC4 | -0.018 | 0.005 | -3.751 | <0.001 |
随机效果 | ||||
组 | 名字 | 方差 | 斯特德 | 科尔 |
试验 | (拦截) | 0.001 | 0.034 | |
项目 | (拦截) | 0.002 | 0.049 | |
主题 | (拦截) | 0.045 | 0.212 | |
PC1 | 4.138e-05 | 0.006 | 0.83 | |
残余 | 0.026 | 0.162 | ||
1879年项目, 99;主题, 21 |
表 6.与响应延迟拟合的混合模型的估计系数、标准误差和 t 和 p 值,为具有 AD 的个人提供真实词语。此表已根据 Cortex3的权限进行了修改。
这里报道的研究解决了另一个问题:与一个词相关的词的词异态数量是否影响单词识别的速度42,43。词干等态是不同语言语境中词干的不同形式。例如,在英语中,脚有两个茎异形,脚和脚。换句话说,词干会根据它是单数形式还是复数形式而变化。这项研究描述了对讲芬兰语的人,与英语相比,芬兰语的干数变化要复杂得多。具有较大词干同态性(即,其茎变化较多的单词)在所有组中引起更快的反应时间(表3、表4和表6;等态数的估计值为负数,这意味着一个词的等态数越高,它引起的反应时间越快,除了MCI组(表5;等态数不是显著的预测变量,因此从模型中被丢弃)。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
本研究使用不需要语言制作的简单语言任务,调查了各种词汇变量对神经健康的年轻人和老年人以及阿尔茨海默氏症患者单词识别的影响。或轻度认知障碍。招募"老年人"所用的年龄范围可能取决于具体的研究兴趣;然而,健康老年人群体的范围应尽可能与为同一研究招募的MCI或AD患者的年龄范围和分布相匹配。
为了避免预测变量之间的共线性,词法变量被正交到主分量中,并添加到混合效果模型中,其中反应时间作为因变量。简单的词法决策实验和混合效应回归分析相结合,导致新的发现,AD患者的语言困难不仅可归因于语义系统的变化,还归因于对语言的依赖程度的提高字形式上。有趣的是,对于轻度认知障碍和认知健康的老年人,也有类似的模式。这表明,对语言处理中基于形式方面的日益依赖可能是书面文字识别中与年龄相关的常见变化的一部分。
在因子设计中,研究人员通常创建两组或多组根据感兴趣的变量而不同的单词集,然后将这些词集与可能影响处理速度的许多其他词法特征匹配。假设在这两组单词之间获得的任何行为差异都应归因于纵的 ( 即不匹配的 ) 变量。这种类型的设计的一个问题是,很难在多个变量上匹配单词集。另一个问题是,由于各种原因,word 集不匹配或无法匹配,可能存在一些潜在的重要变量。此外,因子设计将连续现象视为二分法因素。使用混合效应模型对行为数据进行统计分析,使研究人员能够将潜在的重要词汇变量作为解释变量,而无需根据这些变量匹配单词或单词列表。在混合效果模型中,变量主题(参与者代码/数字)、项目(实验刺激)和试验(试验编号)作为随机效果添加。随机截取之所以包括,是因为假设受试者的总体反应时间不同(即,一些参与者在整体上自然较慢或更快)
该方法可应用于其他类型的问题和其他人群,例如多语种人或失语症患者。对于前一组,语言处理可能与单语不同,因此,在招聘混合语言群体时,应考虑此变量,要么将招聘限制为仅一种类型的群体,要么稍后比较结果以确定是否语言背景影响结果。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
作者没有什么可透露的。
Acknowledgments
我们感谢明娜·莱赫托宁、图莫·亨尼宁、梅里亚·哈利伊宁和希尔卡·索伊宁对这里报道的数据收集和处理所作的贡献。数据收集得到了欧盟支持VPH痴呆症研究的支持,授权协议号为601055。
Materials
Name | Company | Catalog Number | Comments |
E-Prime | Psychology Software Tools | version 2.0.10.356. | |
PC with Windows and Keyboard | |||
R | R Foundation for Statistical Computing | R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/. |
References
- Bybee, J. From Usage to Grammar: The Mind's Response to Repetition. Language. 82 (4), 711-733 (2006).
- Oldfield, R. C., Wingfield, A.
Response latencies in naming objects. The Quarterly Journal of Experimental Psychology. 17, 273-281 (1965). - Nikolaev, A., et al. Effects of morphological family on word recognition in normal aging, mild cognitive impairment, and Alzheimer’s disease. Cortex. 116, 91-103 (2019).
- Milin, P., Feldman, L. B., Ramscar, M., Hendrix, P., Baayen, R. H.
Discrimination in lexical decision. PLoS ONE. 12 (2), 1-42 (2017). - Andrews, S. Frequency and neighborhood size effects on lexical access: activation or search? Journal of Experimental Psychology: Learning, Memory, and Cognition. 15, 802-814 (1989).
- Grainger, J., Muneaux, M., Farioli, F., Ziegler, J. C. Effects of phonological and orthographic neighbourhood density interact in visual word recognition. The Quarterly Journal of Experimental Psychology. 58 (6), 981-998 (2005).
- Ossher, L., Flegal, K. E., Lustig, C. Everyday memory errors in older adults. Aging, Neuropsychology, and Cognition. 20, 220-242 (2013).
- Barresi, B. A., Nicholas, M., Connor, L. T., Obler, L. K., Albert, M. Semantic degradation and lexical access in age-related naming failures. Aging, Neuropsychology, and Cognition. 7, 169-178 (2000).
- Chertkow, H., Whatmough, C., Saumier, D., Duong, A. Cognitive neuroscience studies of semantic memory in Alzheimer's disease. Progress in Brain Research. 169, 393-407 (2008).
- Cuetos, F., Arce, N., Martínez, C. Word recognition in Alzheimers’s disease: Effects of semantic degeneration. Journal of Neuropsychology. 11, 26-39 (2015).
- Stilwell, B. L., Dow, R. M., Lamers, C., Woods, R. T. Language changes in bilingual individuals with Alzheimer’s disease. International Journal of Language & Communication Disorders. 51, 113-127 (2016).
- Obler, L. K. Language and brain dysfunction in dementia. Language functions and brain organization. Segalowitz, S. , Academic Press. New York, NY. 267-282 (1983).
- Obler, L. K., Albert, M. L. Language in the elderly aphasic and in the demented patient. Acquired aphasia. Sarno, M. T. , Academic Press. New York. 385-398 (1981).
- Obler, L. K., Gjerlow, K. Language and the brain. , Cambridge University Press. Cambridge. (1999).
- McKhann, G. M., et al. The diagnosis of dementia due to Alzheimer’s disease: Recommendations from the National Institute on Aging - Alzheimer’s Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimer’s Dementia. 7, 263-269 (2011).
- Winblad, B., et al. Mild cognitive impairment - beyond controversies, towards a consensus: Report of the International Working Group on Mild Cognitive Impairment. Journal of Internal Medicine. 256, 240-246 (2004).
- Albert, M. S., et al. The diagnosis of mild cognitive impairment due to Alzheimer’s disease: Recommendations from the National Institute on Aging - Alzheimer’s Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimer’s & Dementia: The Journal of the Alzheimer’s Association. 7, 270-279 (2011).
- Hughes, C. P., Berg, L., Danziger, W. L., Coben, L. A., Martin, R. L. A new clinical scale for the staging of dementia. The British Journal of Psychiatry. 140, 566-572 (1982).
- Baayen, R. H. Data Mining at the Intersection of Psychology and Linguistics. Twenty-first century psycholinguistics: Four cornerstones. Cutler, A. , Lawrence Erlbaum Associates Publishers. Mahwah, NJ, US. 69-83 (2005).
- Brants, T., Franz, A. Web 1T 5-gram, version 1. , Linguistic Data Consortium. Philadelphia. (2006).
- Baayen, R. H., Piepenbrock, R., Gulikers, L. The CELEX lexical database (CD-ROM). , Linguistic Data Consortium. Philadelphia, PA. (1995).
- Wagenmakers, E. J., Ratcliff, R., Gomez, P., McKoon, G. A diffusion model account of criterion shifts in the lexical decision task. Journal of Memory and Language. 58, 140-159 (2008).
- Dufau, S., Grainger, J., Ziegler, J. C. How to say “no” to a non-word: a leaky competing accumulator model of lexical decision. Journal of Experimental Psychology: Learning, Memory, and Cognition. 38, 1117-1128 (2012).
- R Core Team. R: A language and environment for statistical computing. , R Foundation for Statistical Computing. Vienna, Austria. (2018).
- Venables, W. N., Ripley, B. D. Modern applied statistics with S. , 4th ed, Springer. New York, NY. (2002).
- Baayen, R. H., Milin, P.
Analyzing reaction times. International Journal of Psychological Research. 3 (2), 12-28 (2010). - Koller, M. robustlmm: An R package for robust estimation of linear mixed-effects models. Journal of Statistical Software. 75 (6), 1-24 (2016).
- Bates, D., Mächler, M., Bolker, B., Walker, S. Fitting Linear Mixed-Effects Models Using lme4. Journal of Statistical Software. 67, 1-48 (2015).
- Kuznetsova, A., Brockhoff, P. B., Christensen, R. H. B. lmerTest Package: Tests in Linear Mixed Effects Models. Journal of Statistical Software. 82, 1-26 (2017).
- Akaike, H. Information theory and an extension of the maximum likelihood principle. Second International Symposium on Information Theory. Petrov, B. N., Csaki, B. F. , Academiai Kiado. Budapest. 267-281 (1973).
- Sakamoto, Y., Ishiguro, M., Kitagawa, G. Akaike Information Criterion Statistics. , D. Reidel Publishing Company. (1986).
- Barr, D. J., Levy, R., Scheepers, C., Tily, H. J. Random effects structure for confirmatory hypothesis testing: Keep it maximal. Journal of Memory and Language. 68, 255-278 (2013).
- Bates, D., Kliegl, R., Vasishth, S., Baayen, H.
Parsimonious mixed models. arXiv:1506.04967v2. , (2015). - Harrison, X. A., et al. Brief introduction to mixed effects modelling and multi-model inference in ecology. PeerJ. 6, 1-32 (2018).
- Kimball, A. E., Shantz, K., Eager, C., Roy, C. E. J. Confronting quasi-separation in logistic mixed effects for linguistic data: a Bayesian approach. Journal of Quantitative Linguistics. , (2018).
- Coltheart, M., Davelaar, E., Jonasson, J. T., Besner, D. Access to the internal lexicon. Attention and performance, vol. VI. Dornick, S. , Hillsdale, New Jersey. Erlbaum. 535-556 (1977).
- Caselli, N. K., Caselli, M. K., Cohen-Goldberg, A. M. Inflected words in production: Evidence for a morphologically rich lexicon. The Quarterly Journal of Experimental Psychology. 69, 432-454 (2016).
- Yarkoni, T., Balota, D., Yap, M. Moving beyond Coltheart’s N: A new measure of orthographic similarity. Psychonomic Bulletin & Review. 15 (5), 971-979 (2008).
- Cohen, G. Recognition and retrieval of proper names: Age differences in the fan effect. European Journal of Cognitive Psychology. 2 (3), 193-204 (1990).
- Kemmerer, D. Cognitive neuroscience of language. , Psychology Press. New York. (2015).
- Baayen, R. H. Analyzing linguistic data: A practical introduction to statistics using R. , Cambridge University Press. Cambridge. (2008).
- Nikolaev, A., Lehtonen, M., Higby, E., Hyun, J., Ashaie, S. A facilitatory effect of rich stem allomorphy but not inflectional productivity on single-word recognition. Applied Psycholinguistics. 39, 1221-1238 (2018).
- Nikolaev, A., et al. Behavioural and ERP effects of paradigm complexity on visual word recognition. Language, Cognition and Neuroscience. 10, 1295-1310 (2014).