将信息技术的前沿领域——人工智能与大数据技术和蕴藏数千年东方智慧的中国古典文献结合在一起,是一个有着深厚潜力和重大文化价值的交叉学科领域。经过二十余年的古籍数字化建设,图书馆界、商业公司以及民间藏家已经生产发布了数量可观的数字化典籍资源,为大数据、深度学习、知识图谱等前沿技术在古籍资源上的应用准备了条件。近年来人工智能技术在古籍OCR、自动句读、命名实体识别等经典问题上的出色表现,使得我们意识到古籍整理工作和古典文献的研究与教学在智能信息环境下正面临一场深刻而广泛的变革。
在此情形下,必赢71886网址登录数字人文研究中心将古籍资源的智能开发与利用作为核心研究目标,并在相关领域取得了一系列进展。为了推动整个行业的发展,在中国古籍保护协会的支持下,北大数字人文中心联合国内多所高校和科研院所的古籍教学与研究机构、图书馆、出版社以及相关企业,将古籍的研究机构、教学单位、收藏机构、出版渠道和商业组织连接在一起,组建了中国古籍保护协会古籍智能开发与利用专业委员。专委会的核心工作目标是:建立古籍领域与信息技术领域交流与协作的渠道,促进人工智能、大数据等信息技术在古籍研究、教学、收藏、出版、开发利用等方面全方位的应用。专委会将凝聚多方社会力量推动古籍数字化、智能化平台的建设以及相关标准规范的形成,促进古籍资源在智能信息环境下的深度开发、利用与传播。
为了实现上述目标,在古籍智能专业委员会的指导下,必赢71886网址登录数字人文中心将筹办系列专题研讨会,邀请古典文献、人工智能、数字人文等领域卓有建树的专家学者以在线研讨会的形式系统讲解古籍智能信息处理所涉及的各个子领域的发展源流、基本知识、技术架构和发展趋势,大范围普及和传播古籍智能领域的基础知识和关键技术,包括:古籍数字化、古文智能信息处理、古籍标注语料库建设、古籍本体知识库构建、古文大数据分析等。既有材料上的拓展和方法上的创新,又有实践层面的指导和理论层面的构筑。通过举办研讨会,我们最终期望能凝练并形成这一交叉领域的系统性的知识体系,促进智能信息环境下古籍整理与研究所需的跨学科人才培养,拓宽古典文献的研究领域,并助力古代汉语、古代文学、古代史、中国哲学等相关学科的升级发展。
目前已规划了十个专题,包括:古籍数字化、古文自然语言处理、古籍知识库构建、古籍资源库建设、古文本分析与研究等。每次研讨会的视频将整理为体系化的课程资料,讲解内容经完善后形成专题综述推送发表。本系列讲座主要面向具备一定信息技术基础的古典文献、古代文学、古代汉语、中国历史与哲学等领域的高校师生,图书馆、出版社等古籍收藏和整理的相关工作者,以及广大的古籍爱好者和软件开发者。欢迎您的参与!
目前已规划的十二讲专题研讨会见下表。我们将根据专家建议和听众需求陆续增设更多研讨专题,欢迎您的宝贵建议和需求反馈:gdhc@pku.edu.cn
第一讲 智能时代古典文献学的机遇与挑战
第二讲 古籍数字化平台的建设
第三讲 历史地理信息系统的建设与发展
第四讲 古籍OCR技术概述与发展趋势
第五讲 古籍目录数据库
第六讲 古代年表与时间本体知识库
第七讲 古籍标注语料库建设
第八讲 古文自然语言处理技术
第九讲 古代历史人物数据库
第十讲 古籍资料库建设
第十一讲 古典文献大数据分析
第十二讲 智能时代古典文献学教育、研究与人才培养
北京字节跳动公益对古籍智能系列研讨活动提供了支持,特此感谢!
各期研讨会的具体时间安排通过“古籍智能”网站和“数字人文开放实验室”及合作机构微信公众号发布,敬请关注:
"古典文献学微刊"公众号
"DH数字人文"公众号
"比特人文"公众号