历史与AI的距离|当AI“读懂”我的西夏文研究
人工智能的浪潮正以亘古未有的速率和深度影响着我们生涯的方方面面,,,从一样平常的谈天助手到重大的科学盘算,,,它的身影无处不在。。。当人工智能(AI)不但能写诗作画、谱曲编程,,,甚至最先涉足解读深邃艰涩的史学文献时,,,一个饶有意见意义的问题也随之浮现:历史学与AI的关系事实将走向何方???????仅仅是高效的工具,,,照旧可能成为引发深度思索的同伴???????历史学这门古老而智慧的学科,,,又将迎来怎样的挑战与机缘???????这即是本文想要与读者配合探讨的故事。。。它可能不但是一段小我私家履历的分享,,,更是对一个正在到来的智能时代中,,,我们怎样与AI共舞、重塑知识生产方法的思索。。。 克日,,,一段由AI天生的对谈音频,,,让我这个一直在盘算机科学的理性与历史人文的感性之间穿梭的数字人文从业者,,,体验到了一种亘古未有的“共振”。。。故事的起源颇为无意:一位友人实验将我数年前揭晓的一篇关于西夏文字典《文海》网络剖析的论文,,,“喂给”了谷歌的AI工具NotebookLM。。。当友人将AI天生的英文对谈音频转给我时,,,我最初的期待或许仅仅是AI能对论文举行一次通例的摘要或信息提取。。。然而,,,效果却远超预期:两个“虚拟人”的对话,,,其兴奋的语气极富熏染力,,,他们不但精准地解读了我研究的焦点,,,并且阐释流通自然、视角独到,,,甚至有些思绪让我感应它似乎比我思量的还要深远。。。那一刻,,,我感受AI不再仅仅是一个酷寒、执行指令的工具,,,它似乎拥有了某种“明确力”,,,成为了一个能够跨越语言障碍、与我举行深度学术对话的“思索同伴”。。。 这场由AI“笼络”的、与自己旧作在新视角下的“意外重逢”,,,不但带来了惊喜,,,更引发了我对AI在历史研究中潜能的深层思索:AI事实在以何种方法介入历史研究???????它又将怎样重塑我们与历史的“距离”,,,以致历史学者自身???????这不但仅关乎手艺的前进,,,更关乎我们怎样认知已往、明确现在、并塑造未来。。。 我的专业是盘算机科学与手艺,,,但一直在陕西师范大学历史文化学院事情,,,这样的交织配景让我自然而然地将手艺融入历史专业研究中,,,近年更专注于数字人文,,,特殊是智能手艺在历史研究中的深度应用。。。2022年揭晓于《数字人文》期刊的《西夏文字典〈文海〉的网络剖析》一文,,,即是我在这方面的一次实验。。。 西夏文,,,这个由党项人在近千年前建设的奇异文字,,,犹如历史长河中一颗颗悄然的星辰,,,纪录着一个王朝的兴衰与文明的印记。。。而《文海》是西夏人自己编辑的“解字书”,,,一定蕴含着深度解读西夏文明的钥匙。。。然而,,,西夏文早已成为一种“死文字”,,,其字形结构之重大、文献数目之重大、字间诠释关系之繁复,,,使得现代学者的西夏文学习与研究之路充满挑战。。。 现在AI手艺对西夏文的自动识别率已经很高,,,在不思量语境的情形下将单个西夏文字转成对应汉字的问题也不大,,,可是要直接将西夏文文本准确地翻译为中文,,,或是释读西夏文草书,,,又或者是大规模地剖析西夏文资料库,,,仍然保存难题。。。 我运用网络剖析要领,,,将《文海》中每一个西夏字视为一个节点,,,字与字之间的诠释关系视为毗连节点的边,,,从而将整部字典转化为一个重大而重大的“西夏字诠释关系网络”。。。这样做的目的是希望通过结构化的数据剖析,,,在展现《文海》内部潜藏的西夏字的组织纪律和西夏人的某些焦点看法与认知结构方面举行一些探索。。。 这项研究的一个焦点孝顺,,,是提出了一种识别《文海》中“基本字集”的要领。。。在AI天生的中文版对谈节目中,,,这个历程被生动地比喻为“洗面筋”。。。说来有趣,,,这个比喻与我之前在课堂上向学生诠释类似看法时所用的表述不约而同,,,这或许与友人最初与AI互动时,,,在Prompt中巧妙地融入了相关指导有关。。。这恰恰是我第一次听到AI用此比喻时感应尤为震撼的缘故原由——它像是一次回响,,,一次人类思索与AI能力在特定指导下的精妙共振。。。想象一下,,,整部《文海》中的字凭证诠释相互关联、交织,,,形成一个像面团一样的网络,,,而888集团算法,,,就像一双不知疲倦的手,,,将“面团”在水中重复搓洗:那些仅仅被其他字诠释,,,而自身不去诠释任何其他字(或者说,,,在诠释网络中只有入度、没有出度)的“最后”字,,,被一层层“洗”去。。。经由多轮迭代,,,最终沉淀下来的,,,即是那些最英华、最基础、无法再被简化、组成整个字典语义基石的焦点部分即基本字集——犹如黏性十足的“面筋”,,,是该语言的“基本构件”。。。 找到了“面筋”,,,下一步即是明确其他字是怎样围绕这个焦点构建起来的。。。研究通过盘算每个非焦点字抵达基本字集的“界说距离”,,,展现了《文海》内部西夏字之间诠释关系清晰的层级结构。。。中文对谈中将这个历程被比作“剥洋葱”:最焦点的基本字集犹如“洋葱心”(第0层),,,仅由该层直接诠释的字组成“洋葱”的第一层,,,只依赖前两层诠释的字组成第二层……云云层层向外扩展。。。英文对谈则给出了另一种比喻——“树”:焦点字集是“树干”,,,其他字则是从树干上生发出的“分枝”,,,越往外延伸,,,字的意义可能越重大,,,其组成也依赖于更靠近树干的字词。。。 AI解读还提出了“回复洋葱”的视角(或顺着“树”的脉络向上追溯):这种从内向外的层级结构,,,是否体现了一条潜在的、高效学习西夏字的路径???????即“从焦点往外学”,,,先掌握最基础的焦点字,,,再逐步明确其衍生字词。。。这或许能让学习这门古老文字的历程,,,不再那么“遥不可及”,,,犹如举行一场有趣的“语言寻宝游戏”。。。这些由AI天生的比喻和引申,,,纵然部分可能源于巧妙的提醒,,,其最终泛起的精准和形象,,,着实令人感应惊艳,,,也让我意识到,,,纵然是对自己的研究,,,AI也能提供富有启发性的“再解读”。。。这种‘再解读’的实力,,,不但仅在于其修辞的巧妙(如英文对谈中将《文海》四字释义模式通过“靴”字的例子比作“视觉拼图”),,,更在于它有时能像一面不带私见的镜子,,,映照出我们习以为常的研究路径中可能保存的盲点,,,提醒我们从全新的角度审阅习以为常的结论。。。 这种将笼统数据结构转化为可明确的知识模子的要领,,,其潜力远不止于《文海》这一孤例。。。在另一个对OPTED(Oxford Plain Text English Dictionary)举行的网络剖析实验中,,,我们进一步见证了AI在毗连笼统数据与详细意义方面的卓越能力。。。 与《文海》研究类似,,,我们通过词与词之间的相互训释关系构建网络,,,同样也发明了一些由词语组成的“强毗连部件”(Strongly Connected Components,,,英文对谈中将其形象地诠释为“网络中的圈子”,,,并以“男子与小孩”相关的字群为例,,,强调其展现了“更深条理的看法联系”)。。。例如,,,实验中找到了一个包括“popovtsy, dukhobors, dukhobortsy, judaizers, bezpopovtsy, molokane, skoptsy, raskolnik, molokany, raskolniki”等一系列与俄罗斯东正教差别教派相关的生僻词汇的部件。。。这些词汇在辞书的网络结构中细密相连,,,这自己就体现了它们之间保存某种逾越简朴词义的深层结构性关联,,,很可能反应了现实天下中特定文化领域的知识图谱或看法簇。。。然而,,,这对不具备相关宗教史配景的人来说,,,这些伶仃的词汇簇犹如一串密码,,,其背后的历史文化意涵难以破译。。。 此时,,,历史学者的专业洞察与AI的叙事能力再次展现了“共生”的魅力。。。我们指导AI,,,以这些“密码词”为焦点,,,讲述一个故事。。。令人惊喜的是,,,AI不但乐成编织了一个连贯的叙事,,,更主要的是,,,它为这些通过手艺要领提取出的笼统关联,,,付与了生动的历史学诠释,,,清晰地勾勒出17世纪以来俄罗斯官方东正教与种种异见教派重大互动的图景。。。这个历程,,,与其说是简朴的语言学习辅助,,,不如说是一次由历史学者主导(提出问题、提供质料、判断偏向)、AI赋能(快速整合信息、天生文本)的小型“历史知识重构”。。。AI在这里饰演了一个要害的桥梁角色,,,它将酷寒的、结构化的数据(词汇网络),,,有用地转化为了有温度、有逻辑的历史叙事。。。这种“点石成金”的应用很好地体现了AI在辅助人文研究者从数据中挖掘意义、构建诠释方面的重大潜力。。。更深一层看,,,这个案例也展现了网络剖析要领自己可以成为历史研究的有力工具,,,其剖析效果(如强毗连部件)能够反应特定历史时期的文化、宗教、社会等方面的特征,,,而AI的介入则极大地加速和深化了对这些手艺发明的历史学解读。。。 现在,,,用大模子做学术总结、文献综述已不鲜见,,,但多是剖析他人的研究。。。这次,,,经由友人的实验,,,让AI来解读和“反刍”我自己的研究事情,,,体验却格外差别。。。这种由AI驱动的、对自己研究的再审阅,,,有时确实能带来“惊艳”的发明,,,让人感受AI不再仅仅是一个工具,,,更像一个能提供新视角的“思索同伴”。。。 这种将长篇语料(如一篇完整的学术论文)交由大模子天生具有一定深度的“对谈形式”的内容,,,比常见的人与AI直接举行即时问答的方法,,,似乎更富有思辨的特点。。。我起源思索,,,可能有以下几个方面的缘故原由:首先是结构化的深度加工。。。当AI面临的是一篇完整的、逻辑严谨的学术论文时,,,它可以举行更为系统和深度的信息处置惩罚。。。为了天生一场有意义的“对谈”,,,AI不但要明确论文的焦点看法、论证历程,,,还要模拟差别对话者的角色、语气,,,甚至设计提问与回覆的逻辑流程。。。这个历程,,,远比处置惩罚碎片化的即时提问要重大,,,也更能驱动AI挪用其深条理的文本明确和知识重构能力。。。其次是多视角的思辨模拟。。。对谈形式自然地蕴含了差别视角的碰撞。。。纵然这些“对话者”是虚拟的,,,AI在设计其讲话时,,,也需要思量到看法的多样性和论证的条理性。。。这使得最终天生的对谈内容,,,更容易泛起出一种思辨的色彩,,,能够从差别侧面展现研究的价值与局限,,,而非仅仅单向的信息输出。。。再者是知识的“反刍”与“再创立”。。。AI在准备对谈内容时,,,现实上是在对原始研究举行一次深度的“反刍”。。。它需要消化、吸收、明确,,,然后用一种新的形式(对话)来重新组织和表达。。。这个历程自己,,,就是一种知识的再加工以致“再创立”。。。正如友人转给我的那份英文对谈,,,其流通的逻辑和精准的用词,,,批注AI在“明确”我的论文后,,,已经能够用另一种语言系统举行高质量的知识迁徙和表达。。。 因此,,,论文作者将自己的研究效果交给AI举行解读和“对话”,,,未来或许会成为一种极有意义的学术反思途径。。。由于作者自己最相识自己研究的初志、历程与细节,,,而一个强盛的AI大模子,,,则像一个知识渊博、逻辑严密、不知疲倦的“贤者”或“心田镜像”,,,作者与它就自己的研究睁开“对话”,,,既能随时随地举行,,,又能包管讨论的深度和专注度。。。在这个历程中,,,险些没有因交流工具知识配景差别而爆发的信息消耗或明确误差,,,或更容易引爆发者自己对研究的深层审阅和新的灵感火花。。。 回首我与AI围绕《文海》论文的那次“奇遇”,,,最令我触动的,,,并非AI的“博学”或“高效”,,,而是它所展现出的成为一个“思索同伴”的潜力。。。“思索同伴”,,,意味着AI不再仅仅是一个被动吸收指令、输出效果的工具,,,而是能够在与人类智慧的有用互动中,,,以某种方法加入到888集团思索历程中,,,提供启发、反响。。,,甚至以其奇异的“视角”挑战888集团既有认知。。。在解读《文海》网络剖析的研究时,,,AI所用的“洗面筋”、“剥洋葱”的比喻,,,以及“回复洋葱”的学习路径意料,,,即是有力的例证。。。正如前文提及,,,“洗面筋”这一精妙比喻的泛起,,,很可能与友人最初在Prompt中融入了相关的指导性表述有关,,,这自己就生动地诠释了AI的洞察力并非凭空而来,,,而是人类智慧与AI能力在特定指导下配合催生的效果。。。更令人兴奋的是英文对谈中提及的萨丕尔-沃尔夫假说,,,一种语言的结构(例如《文海》所展现的奇异的层级结构和焦点看法组织方法)是否会反过来塑造使用该语言群体的头脑模式和天下感知方法???????对《文海》这类奇异语言系统的深入剖析,,,或许能为这一经典命题提供新的实证质料。。。而明确人类组织语言的重大方法,,,无疑也能为开发更智能、更具明确力的人工智能系统提供名贵的启示,,,甚至引发我们对知识实质及其相互关联方法的深刻追问,,,这些都远远逾越了语言学或历史学自己的领域,,,虽然肯定也凌驾了我的论文讨论的规模。。。 这种“双向互动”的模式,,,可能会对未来的历史研究带来诸多深刻的厘革。。。它可以加速知识发明与整合,,,资助研究者在浩如烟海的文献资料中快速定位信息、识别模式、建设关联。。。它能够资助学者跳出面脑定势,,,AI基于大规模数据训练形成的“视角”,,,有时能资助我们发明那些被忽略的联系或提出意想不到的问题。。。它还能增进跨学科对话与融合,,,AI可以作为差别学科知识之间的“桥梁”,,,资助历史学者明确和运用其他学科的理论与要领,,,而这座桥梁的搭建偏向、承载内容的选择以及最终意义的付与,,,始终掌握在历史学者的手中。。。 AI真正成为“思索同伴”,,,绝对无法一蹴而就,,,而是一个历史学者与AI手艺配合进化、“相互导航”的历程。。。学者自身深挚的专业素养、清晰的问题意识和开放的探索心态是驱动这一历程的引擎。。。我们学会怎样与AI“对话”,,,怎样设计出能够引发AI深度潜能的Prompt,,,怎样提出直击实质的问题,,,怎样辩证地明确AI的“思索方法”,,,以及怎样将AI的洞察与人类的智慧有机连系——这些探索自己,,,就在一直地为AI的能力界线和应用场景“校准”偏向。。。反过来,,,AI的每一次能力跃升,,,也都在为历史学者开发新的研究领土,,,促使其一直调解和确立自身的“时代新坐标”。。。这种动态的“共生坐标”简直立,,,可能正是AI时代学术研究最富魅力和最具潜力的图景。。。 从《文海》的网络剖析,,,到AI对这项剖析的跨语言解读与“反刍”,,,再到OPTED辞书中AI的叙事能力,,,我们看到了一条清晰的轨迹:数字手艺与人文研究的融合,,,正在从最初的数据化、可视化,,,走向更深条理的智能化、交互化。。。 AI的介入,,,无疑正在改变“历史与AI的距离”。。。它们之间的路径不再是单向的、静态的,,,而是充满了动态的交互与无限的可能性。。。AI既带来了怎样确保研究严谨性、阻止手艺滥用等挑战,,,更带来了亘古未有的机缘,,,让我们能以一种全新的方法去亲近历史、明确已往、并从中罗致面向未来的智慧。。。这不但仅是关于一个古老字典或一种死文字的研究,,,它更关乎人类的好奇心、明确已往的盼愿,,,以及这些探索怎样与我们当下的语言学习、教育刷新以致手艺生长爆发惊人的关联。。。 正如我在复旦大学的报告《AI赋能史学研究新视野—从跨语言文献剖析到深度历史探讨》中所期待的,,,AI的真正价值,,,不在于替换学者的思索,,,而在于增强学者的思索;;;;;不在于给出唯一的标准谜底,,,而在于引发更多元的历史想象。。。未来,,,历史学家与AI或许会像一对默契的舞伴,,,在海量的历史数据与深邃的人类智慧之间,,,配合探索历史研究的崭新领土。。。而每一次像“AI读懂我的西夏文研究”这样的“小确幸”,,,都让我们对这个充满无限可能的未来,,,多了一份期待与信心。。。 [作者张光伟系陕西师范大学历史文化学院讲师,,,担当陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心副主任,,,主要从事"人工智能+历史学"交织学科研究:(1)基于深度学习的中国古文字识别与智能古籍数字化,,,历史地舆信息的多维度提取与可视化重构;;;;;(2)大模子与历史研究的深度融合;;;;;(3)虚拟仿真实验手艺在历史研究与教学中的应用,,,国家一流本科虚拟仿真实验课程“敦煌石窟历史实践教学虚拟仿真实验”手艺认真人。。。]




京公网安备11010202000001号

trap
.
.
-->