听见历史的声音:一位青年学者的工运史数字探索——让上海工人三次武装起义口述史料“重生”

来源:劳动观察 作者:王海雯 发布时间:2026-03-18 14:34

摘要: 上海大学历史学系博士后陆轶隽从一字一句的手工誊录出发,引入数字人文技术,尝试为工运史研究打开新的入口。

头图:陆轶隽(右)采访工人运动史料委员会成员郑庆声先生。


2026年3月21日,是上海工人第三次武装起义胜利99周年。近七十年前,1957年至1958年,上海市工会联合会下设的工人运动史料委员会曾系统访谈上海工人运动的亲历者,留下120份、约65万字的口述史料,涵盖了从五卅运动到上海三次武装起义等重大历史事件。然而,这份珍贵的“老工人谈话记录”因体量庞大、整理难度高,长期“沉睡”于档案柜之中。


如何让这些带着温度的历史重新被看见?上海大学历史学系博士后陆轶隽选择用一种“笨功夫”与“新方法”——从一字一句的手工誊录出发,引入数字人文技术,尝试为工运史研究打开新的入口。


“老工人谈话记录”原稿


“手抄”65万字:

走进工人记忆的历史现场


陆轶隽与这批史料的相遇,始于一次学术活动。


当时,还在上海师范大学攻读博士学位的他结识了上海社会科学院历史研究所研究员马军。作为“老工人谈话记录”的主要保管者,马军向陆轶隽建议博士论文选题时,将这批史料郑重推荐给他。在他看来,这不仅是一份材料,更是一段尚待深入发掘的历史记忆。


陆轶隽(后排左一)、社科院研究员马军(后排右一)与郑庆声(前排)先生合影


“第一次翻开这些资料时,我很震撼。”陆轶隽回忆,“它们已经尘封六十多年,但每一页都很‘活’,是普通工人在用自己的语言讲述历史。”


从2021年6月至2022年1月,陆轶隽几乎每天往返于档案室与办公室之间,花了半年多时间,将65万字口述史料一字一句录入电脑。“这个过程很慢,但也正因为慢,我才真正觉得自己进入了历史的现场。”他说。


在一段关于1927年3月21日的回忆中,老工人刘保民这样讲述起义当日闸北地区的战斗情形:“我刚挤出铁门,铁门就关起来了,还没有到十二点钟,暴动已经开始。闸北第五分局已经给工人打下来了……他们撕了一块红布给我,把袖子拥了起来作为标记。有十几个人跟我一起走,后面连小孩子等大概有四、五十个人跟着。”


“老工人谈话记录”之“薛兆圣谈话记录”原稿部分


另一位老工人薛兆圣则回忆北火车站一带的战斗:“杨树浦那里的纠察队从邢家木桥那里过来,他们有二三十个人,男的女的都有,身上缚了红带子,有人带了枪……后来北伐军来了,我们还替他们领路。”


“这些不是教科书里的宏大叙事,而是普通人眼中的历史。”陆轶隽说,“你会意识到,历史是那么的真切,它就在这些具体的细节里。”


在整理过程中,他还多次拜访史料委员会成员中当时唯一仍健在的郑庆声先生。老一辈研究者关于当年采集史料的讲述,让他更加理解这批资料的来之不易。“他们当年的坚持,本身就是一种学术传统。”在陆轶隽的博士论文答辩之前的2025年5月9日,郑庆声先生因病逝世,享年91岁。


主题建模:

在海量文本中“看见结构”


完成誊录之后,新的问题随之而来:如何读懂这65万字?


传统史学研究依赖逐篇阅读与人工归纳,但面对如此体量的文本,很难迅速且精准地把握整体脉络。也正是在这一阶段,陆轶隽开始思考:是否可以借助数字人文的研究路径,让史料“自己说话”。


在海外的访学经历,帮助他选择引入“主题建模”方法。这是一种基于统计学的文本分析技术,通过识别词语之间的共现关系,从大量文本中提炼出若干潜在主题。“可以把它理解为一位非常有耐心的‘读者’。”陆轶隽说,“当文本规模很大时,人不容易发现隐藏于文本的若干主题及其相应所占的内容比重,而算法可以先帮我们‘看到轮廓’。”



在实践中,他借助人工智能辅助编程完成数据处理——通过自然语言描述需求,快速生成代码,实现分词、清洗、建模及可视化分析。“过去可能需要几个月的工作,现在只需很短时间就能跑完一轮模型。”


当分析结果呈现出来,一些原本隐约存在的结构逐渐清晰:围绕“群众”“团结”“胜利”的叙述,集中反映工人组织化动员;以“斗争”“帝国主义”“进厂”为关键词的文本,则指向当时的劳动环境与社会处境。与此同时,“邓中夏”“刘华”“汪寿华”等名字频繁出现,勾勒出早期工运领导人在工人心中的位置。“这些发现,并不是替代阅读,而是提示我们去哪里‘细读’。”陆轶隽说。


通过主题建模技术,陆轶隽不仅克服了史料中的诸多问题,例如受访者的记忆误差等,还借助建模结果构建了事件与“现实”之间的关联。以“斗争”等关键词为例,它们既留存了受访者当年参与革命活动的激昂情怀,也连贯地体现了上世纪50年代上海总工会期望以这些经历激励青年工人珍视革命成果的宣传理念。如此一来,技术方法为史料的阐释赋予了独特的魅力。


科学分析之外:

让历史被更多人“听见”


在陆轶隽看来,数字人文方法的意义,并不仅在于技术本身。


围绕这批口述史料,他正尝试推进一系列工作:建立可检索的工运口述史料信息库,绘制主题建模图谱,呈现1920年代上海工人运动的组织结构与动员网络,并形成相关研究成果。


“运用数字技术并不是为了取代传统史学研究方法。”他说,“细读、考证依然重要,但技术可以帮助我们打开新的观察视角。”


更重要的是,这种尝试让一度沉睡的历史重新进入公共视野。那些百年前关于街头奔走、临时集结、彼此呼应的记忆,不再只是档案柜中的纸张,而开始以新的方式被理解、被讲述。


站在三次武装起义99周年的节点回望,陆轶隽更愿意把自己的工作看作一种“接力”——从上世纪五十年代的史料采集者,到今天的研究者,不同时代的人以不同方式记录与解读同一段历史。

责任编辑:李轶捷
劳动观察新闻,未经授权不得转载
收藏

相关新闻

寻找工会传家宝|郑庆声遗稿捐赠上...

首页

顶部