金声玉亮2.0模型评测报告

问题

请你做一道语文阅读理解题，其中包含三个小题。
请你一步一步思考。每一题你将从A，B，C，D中选出正确的答案，并写在【答案】和<eoa>之间。
例如：（1）【答案】 A <eoa>
（2）【答案】 B <eoa>
请你严格按照上述格式作答。
（一）论述类文本阅读（本题共3小题，9分）
阅读下面的文字，完成下面小题。
对于人文研究来说，计算方法以往只是作为辅助手段而存在的，而今天已取得了不可
替代的地位。一种新的人文研究形态应运而生，这就是“数字人文”。学者莫莱蒂曾设想
一种建立在全部文学文本之上的世界文学研究，人们必须借助计算机对大规模的文学文本
集合进行采样、统计、图绘，分类，描述文学史的总体特征，然后再做文学评论式的解读。
为此，他提出了与“细读”相对的“远读“作为方法论。弄清计算机的远读与人的细读之
间的差别，不仅能使我们清晰地界定计算方法在人文研究中的作用，而且可以帮助我们重
新确立人的阅读的价值。
计算机是为科学计算而创造出来的，擅长的是“计数”，而非理解。要处理自然语言
文本，计算机必须先将文本置换成便于计数的词汇集合，或者用更复杂的代数模型和概率
模型来表示文本，这一过程被称为“数据化”。数据化之后所得到的文本替代物（集合、
向量、概率）虽然损失了原始文本的丰富语义，但终究是可以计算的了。不过，尽管计算
机能处理海量的语料，执行复杂的统计、分类、查询等任务，但它并不能理解文本的内容。
远读是数字人文的基石。大规模的文本集合上的远读，基本上可以归为两类：一是对
文本集合整体统计特征的描述，一是对文本集合内在结构特征的揭示。例如，数字人文学
者米歇尔等人对数百万册数字化图书进行多种词汇和词频统计，以分析英语世界的语言演
变，这属于前者；莫莱蒂用地图、树结构来分别展示文学作品的地理特征和侦探故事的类
型结构，这属于后者。无论是宏观统计描述还是内在结构揭示，都是超越文本具体内容的
抽象表示，所得结果都是需要解读的。正如米歇尔所说，在巨量文本集合上得到的统计分
析结果，为人文材料的宏观研究提供了证据；但是要解读这些证据，就像分析古代生物化石一样，是有挑战性的。对远读结果的解读，仍然是依赖学者在细读文本的基础上所建立
起来的对本领域的认知和理解。一句话，人的阅读不可替代。
需要补充的是，当考查单篇文本的文本特征（例如计算一篇文档中所有单字的出现频
率），或者分析其内部结构（例如提取一部小说中所有人物的对话网络）时，数据量也会
增长到个人无法处理的程度。所以，上述对文本集合所做的讨论在单篇文本层面也是成立
的。
一个普遍存在的对数字人文的评判依据，是看数字人文能不能更好地回答传统人文学
者所关心的问题。严格说来，只有当数据量或者数据精度超出了个人阅读理解的能力范围
时，才有理由借助计算机来对文本或者文本集合的特征予以量化描述，进而提供给人去进
行深入解读。数字人文不仅仅是新的手段和方法，更重要的是，它赋予我们提出新问题的
能力。我们现在可以问，五千年来全人类使用最频繁的词是什么。透过这类问题，可以获
得观察超长历史时段文化现象的新视角。
（摘编自王军《从人文计算到可视化——数字人文的发展脉络梳理》）
1.下列关于原文内容的理解和分析，不正确的一项是（）
A.在数字人文的概念提出之前，计算方法已被引入人文领域，在研究中发挥作用。
B.要实现莫莱蒂设想的世界文学研究，首先应进行大规模的文学文本集合的数据化。
C.选择远读还是细读的方法，取决于阅读的对象是大规模的文本集合还是单篇文本。
D.数字人文不仅为文本处理提供了新的手段和方法，而且为人文研究提供了新视角。
2.下列对原文论证的相关分析，不正确的一项是（）
A.文章区分“计数”与“理解”，是为了论证计算机不能处理某些特定类型的文本。
B.文章转述数字人文学者米歇尔本人的说法，有助于论证应该更全面地看待远读。
C.文章第四段讨论单篇文本层面的问题，对前文补充论证，使得论证更加周密。
D.文章同时肯定计算机远读和人的细读的作用，有助于避免人们对远读的误解。
3.根据原文内容，下列说法正确的一项是（）
A.人文研究的主体，在数字人文中实现了从具体的学者个人向计算机的转变。
B.远读不是要深化对文本内容的理解，而是要发掘文本集合的共同形式特征。
C.数字人文的价值，在于将历史上未被注意和阅读的文本都进行数据化并做研究。
D.和人的细读相比，远读的理念和做法体现出大数据时代文理融合的跨学科取向。

答案

模型	模型答案	正确答案
金声玉亮2.0	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	C
deepseekr1	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	C
gpto1	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	C
GPT-4o	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	['C', 'A', 'D']
llama3.1-70B-Instruct	（1）【答案】 A <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	['C', 'A', 'D']
llama3.1-405B-Instruct	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	['C', 'A', 'D']
DeepSeek-Coder-V2	"（1）【答案】 C <eoa>\n（2）【答案】 A <eoa>\n（3）【答案】 D <eoa>"	['C', 'A', 'D']
Qwen2-72B-Instruct	"（1）【答案】 C <eoa>\n（2）【答案】 A <eoa>\n（3）【答案】 D <eoa>"	['C', 'A', 'D']
baichuan4	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	['C', 'A', 'D']
doubao	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	['C', 'A', 'D']
minimax	（1）【答案】C<eoa> （2）【答案】A<eoa> （3）【答案】D<eoa>	['C', 'A', 'D']
kimi	1.【答案】A <eoa> 2.【答案】A <eoa> 3.【答案】D <eoa>	['C', 'A', 'D']
wenxinyiyan	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa> 解析：（1）C项“取决于阅读的对象是大规模的文本集合还是单篇文本”错误，属混淆肯定否定。原文第三段是说“大规模的文本集合上的远读，基本上可以归为两类：一是对文本集合整体统计特征的描述，一是对文本集合内在结构特征的揭示”“当考查单篇文本的文本特征或者分析其内部结构时，数据量也会增长到个人无法处理的程度”，文章区分“大规模的文本集合”与“单篇文本”，只是为了说明两者在处理数据量上有区别，至于选择“远读”还是“细读”的方法，并不能据此确定。因此选择C。（2）A项“是为了论证计算机不能处理某些特定类型的文本”分析错误，文章区分“计数”与“理解”，是为了论证“计算机擅长的是‘计数’，而非‘理解’，计算机并不能理解文本的内容”。因此选择A。（3）A项“人文研究的主体，在数字人文中实现了从具体的学者个人向计算机的转变”错误，这一说法夸大了计算机的作用，原文第三段说“对远读结果的解读，仍然是依赖学者在细读文本的基础上所建立起来的对本领域的认知和理解”，可见，在数字人文中，计算机只是为人文研究提供了新的方法和手段，具体的研究还是需要学者去完成。B项“不是要深化对文本内容的理解”错误，这一说法与文意不符，原文第三段说“无论是宏观统计描述还是内在结构揭示，都是超越文本具体内容的抽象表示，所得结果都是需要解读的”，可见，远读同样需要深化对文本内容的理解，只是其解读方式与细读不同。C项“在于将历史上未被注意和阅读的文本都进行数据化并做研究”错误，以偏概全，原文第五段是说“透过这类问题，可以获得观察超长历史时段文化现象的新视角”，数字人文的价值不仅仅在于将历史上未被注意和阅读的文本进行数据化并做研究，其更大的价值应为在新的视角下获得对文化现象的新认识。因此选择D。	['C', 'A', 'D']
zhipu	（1）【答案】 C <eoa> 解析：根据原文内容，选择远读还是细读的方法，并不仅仅取决于阅读的对象是大规模的文本集合还是单篇文本。原文提到，即使是单篇文本，当数据量增长到个人无法处理的程度时，也需要借助计算机进行远读。因此，C选项的理解是不正确的。（2）【答案】 A <eoa> 解析：文章区分“计数”与“理解”，主要是为了说明计算机在处理文本时的局限性，即擅长计数但无法理解文本内容，而不是为了论证计算机不能处理某些特定类型的文本。因此，A选项的分析是不正确的。（3）【答案】 D <eoa> 解析：根据原文内容，数字人文的价值不仅在于数据化文本，更重要的是提供了新的研究视角和方法，使得人文研究能够提出和解答新的问题。A选项错误，因为人文研究的主体仍然是学者个人，计算机只是工具；B选项错误，因为远读不仅仅是发掘共同形式特征，还需要对结果进行解读；C选项错误，因为数字人文的价值不仅在于数据化未被注意的文本。因此，D选项是正确的，远读的理念和做法体现了大数据时代文理融合的跨学科取向。	['C', 'A', 'D']
gpto1	（1）【答案】 C <eoa> （2）【答案】 A <eoa> （3）【答案】 D <eoa>	C
deepseekv3	1. 原文中提到“计算方法以往只是作为辅助手段而存在的，而今天已取得了不可替代的地位”，说明计算方法在数字人文概念提出之前已经在人文领域发挥作用，因此A项正确。原文提到莫莱蒂设想的建立在全部文学文本之上的世界文学研究需要借助计算机对大规模的文学文本集合进行采样、统计等，这表明首先需要进行数据化，因此B项正确。原文中并没有提到选择远读还是细读的方法取决于阅读的对象是大规模的文本集合还是单篇文本，而是强调远读和细读的差别，以及人的阅读不可替代，因此C项不正确。原文最后提到数字人文不仅提供了新的手段和方法，还赋予了提出新问题的能力，因此D项正确。综上所述，C项不正确。【答案】 C <eoa> 2. 文章区分“计数”与“理解”是为了说明计算机擅长计数但不擅长理解，而不是论证计算机不能处理某些特定类型的文本，因此A项不正确。文章转述米歇尔的说法是为了说明远读结果的解读需要依赖学者的细读，因此B项正确。文章第四段讨论单篇文本层面的问题，对前文进行了补充论证，使得论证更加周密，因此C项正确。文章同时肯定了计算机远读和人的细读的作用，有助于避免人们对远读的误解，因此D项正确。综上所述，A项不正确。【答案】 A <eoa> 3. 原文中并没有提到人文研究的主体从具体的学者个人向计算机转变，而是强调人的阅读不可替代，因此A项不正确。原文中提到远读是对文本集合整体统计特征的描述和内在结构特征的揭示，而不是深化对文本内容的理解，因此B项正确。原文并没有提到数字人文的价值在于将历史上未被注意和阅读的文本都进行数据化并做研究，而是强调数字人文提供了新的手段和方法以及提出新问题的能力，因此C项不正确。原文中提到远读是数字人文的基石，并且与人的细读相对，但并没有直接提到远读的理念和做法体现出大数据时代文理融合的跨学科取向，因此D项不正确。综上所述，B项正确。【答案】 B <eoa>	C

模型

模型答案

正确答案

金声玉亮2.0

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

deepseekr1

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

gpto1

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

GPT-4o

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

['C', 'A', 'D']

llama3.1-70B-Instruct

（1）【答案】 A <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

['C', 'A', 'D']

llama3.1-405B-Instruct

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

['C', 'A', 'D']

DeepSeek-Coder-V2

"（1）【答案】 C <eoa>\n（2）【答案】 A <eoa>\n（3）【答案】 D <eoa>"

['C', 'A', 'D']

Qwen2-72B-Instruct

"（1）【答案】 C <eoa>\n（2）【答案】 A <eoa>\n（3）【答案】 D <eoa>"

['C', 'A', 'D']

baichuan4

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

['C', 'A', 'D']

doubao

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

['C', 'A', 'D']

minimax

（1）【答案】C<eoa>
（2）【答案】A<eoa>
（3）【答案】D<eoa>

['C', 'A', 'D']

kimi

1.【答案】A <eoa>
2.【答案】A <eoa>
3.【答案】D <eoa>

['C', 'A', 'D']

wenxinyiyan

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

解析：
（1）C项“取决于阅读的对象是大规模的文本集合还是单篇文本”错误，属混淆肯定否定。原文第三段是说“大规模的文本集合上的远读，基本上可以归为两类：一是对文本集合整体统计特征的描述，一是对文本集合内在结构特征的揭示”“当考查单篇文本的文本特征或者分析其内部结构时，数据量也会增长到个人无法处理的程度”，文章区分“大规模的文本集合”与“单篇文本”，只是为了说明两者在处理数据量上有区别，至于选择“远读”还是“细读”的方法，并不能据此确定。因此选择C。

（2）A项“是为了论证计算机不能处理某些特定类型的文本”分析错误，文章区分“计数”与“理解”，是为了论证“计算机擅长的是‘计数’，而非‘理解’，计算机并不能理解文本的内容”。因此选择A。

（3）A项“人文研究的主体，在数字人文中实现了从具体的学者个人向计算机的转变”错误，这一说法夸大了计算机的作用，原文第三段说“对远读结果的解读，仍然是依赖学者在细读文本的基础上所建立起来的对本领域的认知和理解”，可见，在数字人文中，计算机只是为人文研究提供了新的方法和手段，具体的研究还是需要学者去完成。B项“不是要深化对文本内容的理解”错误，这一说法与文意不符，原文第三段说“无论是宏观统计描述还是内在结构揭示，都是超越文本具体内容的抽象表示，所得结果都是需要解读的”，可见，远读同样需要深化对文本内容的理解，只是其解读方式与细读不同。C项“在于将历史上未被注意和阅读的文本都进行数据化并做研究”错误，以偏概全，原文第五段是说“透过这类问题，可以获得观察超长历史时段文化现象的新视角”，数字人文的价值不仅仅在于将历史上未被注意和阅读的文本进行数据化并做研究，其更大的价值应为在新的视角下获得对文化现象的新认识。因此选择D。

['C', 'A', 'D']

zhipu

（1）【答案】 C <eoa>
解析：根据原文内容，选择远读还是细读的方法，并不仅仅取决于阅读的对象是大规模的文本集合还是单篇文本。原文提到，即使是单篇文本，当数据量增长到个人无法处理的程度时，也需要借助计算机进行远读。因此，C选项的理解是不正确的。

（2）【答案】 A <eoa>
解析：文章区分“计数”与“理解”，主要是为了说明计算机在处理文本时的局限性，即擅长计数但无法理解文本内容，而不是为了论证计算机不能处理某些特定类型的文本。因此，A选项的分析是不正确的。

（3）【答案】 D <eoa>
解析：根据原文内容，数字人文的价值不仅在于数据化文本，更重要的是提供了新的研究视角和方法，使得人文研究能够提出和解答新的问题。A选项错误，因为人文研究的主体仍然是学者个人，计算机只是工具；B选项错误，因为远读不仅仅是发掘共同形式特征，还需要对结果进行解读；C选项错误，因为数字人文的价值不仅在于数据化未被注意的文本。因此，D选项是正确的，远读的理念和做法体现了大数据时代文理融合的跨学科取向。

['C', 'A', 'D']

gpto1

（1）【答案】 C <eoa>
（2）【答案】 A <eoa>
（3）【答案】 D <eoa>

deepseekv3

1. 原文中提到“计算方法以往只是作为辅助手段而存在的，而今天已取得了不可替代的地位”，说明计算方法在数字人文概念提出之前已经在人文领域发挥作用，因此A项正确。原文提到莫莱蒂设想的建立在全部文学文本之上的世界文学研究需要借助计算机对大规模的文学文本集合进行采样、统计等，这表明首先需要进行数据化，因此B项正确。原文中并没有提到选择远读还是细读的方法取决于阅读的对象是大规模的文本集合还是单篇文本，而是强调远读和细读的差别，以及人的阅读不可替代，因此C项不正确。原文最后提到数字人文不仅提供了新的手段和方法，还赋予了提出新问题的能力，因此D项正确。综上所述，C项不正确。

【答案】 C <eoa>

2. 文章区分“计数”与“理解”是为了说明计算机擅长计数但不擅长理解，而不是论证计算机不能处理某些特定类型的文本，因此A项不正确。文章转述米歇尔的说法是为了说明远读结果的解读需要依赖学者的细读，因此B项正确。文章第四段讨论单篇文本层面的问题，对前文进行了补充论证，使得论证更加周密，因此C项正确。文章同时肯定了计算机远读和人的细读的作用，有助于避免人们对远读的误解，因此D项正确。综上所述，A项不正确。

【答案】 A <eoa>

3. 原文中并没有提到人文研究的主体从具体的学者个人向计算机转变，而是强调人的阅读不可替代，因此A项不正确。原文中提到远读是对文本集合整体统计特征的描述和内在结构特征的揭示，而不是深化对文本内容的理解，因此B项正确。原文并没有提到数字人文的价值在于将历史上未被注意和阅读的文本都进行数据化并做研究，而是强调数字人文提供了新的手段和方法以及提出新问题的能力，因此C项不正确。原文中提到远读是数字人文的基石，并且与人的细读相对，但并没有直接提到远读的理念和做法体现出大数据时代文理融合的跨学科取向，因此D项不正确。综上所述，B项正确。

【答案】 B <eoa>