WAP手机版 RSS订阅 加入收藏  设为首页
盈禾体育平台
当前位置:首页 > 盈禾体育平台

盈禾体育平台:文本中的重要信息和难点词已经根据不同类型的名称

时间:2021/11/21 11:03:22   作者:   来源:   阅读:3   评论:0
内容摘要:五千年的中国古代典籍,记载着中华民族宝贵的文化代码。浙江大学徐永明教授和他的团队多年来一直致力于文史大数据的结构化和智能化建设。从2018年的“学术地图出版平台”到2020年的“智慧古籍平台”,团队取得了多项学术成果,使故宫藏文物和古籍文字“活”起来。据报道,“智慧古籍平台”综合运用测量统计、位置查询、聚类查询、空间分...
五千年的中国古代典籍,记载着中华民族宝贵的文化代码。浙江大学徐永明教授和他的团队多年来一直致力于文史大数据的结构化和智能化建设。

从2018年的“学术地图出版平台”到2020年的“智慧古籍平台”,团队取得了多项学术成果,使故宫藏文物和古籍文字“活”起来。

据报道,“智慧古籍平台”综合运用测量统计、位置查询、聚类查询、空间分析、数据关联等大数据技术,对中国古典文献和研究成果进行测绘和智能化。

记者看到,只要你点击主页上的“写作指南”页面的“智能古籍平台”,您可以查看基本信息如章节列表,摘要的写作,和谱系图和相关作者的社会关系图;点击“页面指南”即可进入文字阅读界面。

为了提高文本的准确性,减少阅读时频繁查阅相关资料的工作量,该平台还提供古籍图片与古籍数字化文本的一一对应功能和关键词解读功能。

例如,文本中的重要信息和难点词已经根据不同类型的名称、地名、时间、典故等以不同颜色显示,点击查看不同类型的解读。同时,“智慧古籍平台”与学术地图出版平台对接。点击“作者详细信息”可以查看连接图的路径图。

看似方便的阅读体验与早期的检查密不可分。据报道,上传至“智能古籍平台”的文件将经过OCR识别、机器标点、手工校对、专家评审、机器标引、标引评审等程序。审核无误后,可以在前台发布。

OCR识别是一种“光学字符识别”技术。该技术可以更准确地识别刻字古籍,并将图像文本转换为文本格式。同时借助机器古籍标点技术,可以在古籍文本上自动标注现代汉语标点符号,两者的准确率均在90%以上。


相关评论

本类更新

本类推荐

本类排行

本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下(盈禾体育官网