> 自媒体 > (AI)人工智能 > 想与“荀子”对话不?南农团队牵头研发出全国首个“古籍版ChatGPT”
想与“荀子”对话不?南农团队牵头研发出全国首个“古籍版ChatGPT”
来源:紫牛新闻
2023-12-12 11:02:20
537
管理

12月11日,记者从南京农业大学获悉,该校信息管理学院王东波教授研究团队研发的“荀子”古籍大语言模型发布,这是国内首个专门应用于古籍处理与研究的智能工具,包含了《四库全书》在内的古籍文献超20亿字大型语料库,能够实现自然语言理解、自动翻译、诗歌生成、自动标引等多项功能,作为开源的、公益的研究成果,该模型已在GitHub、ModelScope等网站开源。

为何取名“荀子”?据王东波介绍,荀子,不仅是我国先秦时期伟大的朴素唯物主义的思想家,也是一位散文大家。在对他作品的深入研讨中团队发现,他在语言学理论的阐述上也是一位开拓者,命名荀子是为了纪念这位中国历史上的语言学先驱。对于普通受众而言,想要走近繁体、竖版、未添加句逗的古文不是一件容易的事,而“荀子”的上线意味着在智媒时代和古籍对话成为可能。

“咱们请它以金陵为主题,生成一首五言绝句。”王东波现场演示了“荀子”的智能写诗功能,指令一输入,系统便生成了一首堪称绝妙的原创绝句:“秦淮佳丽地,城阙望中迷。 柳暗青丝发,花香碧玉衣。 歌楼留夜色,画阁敛春晖。细雨轻舟去,双鱼梦泽飞。”

除此之外,古文的阅读理解、标点添加,以及将古汉语翻译为现场汉语,这些让受众难啃的“硬骨头”,“荀子”可以轻松拿下。

对于领域专家而言,可以借助“荀子”完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等专业古籍研究处理场景。同时发布的基座模型,还可以让用户根据自己的需求,使用本地的训练语料微调“荀子”基座模型,使其在古籍下游处理任务上取得更优越的处理性能。

尽管目前有200多个通用模型在各领域得到应用,但古籍领域仍缺乏专业的大语言模型。功能强大的 “荀子”到底是怎么做到化繁为简、通读古今的呢?“首先是‘算力充足’并且‘饱读经书’!”王东波介绍,“荀子”的顺利问世离不开南京农业大学提供的高性能算力基础设施支持,以及团队长期积累的大量标注、精加工语料库,团队给“荀子”投喂了40亿字大型混合语料数据。

“模型的构建受算力、场景应用等多方影响,但精准度较高的优质数据,是最为关键的。”据王东波介绍,团队从2008年开始接触古籍,2013年至今一直专注于人工精标注数据的工作。“比如《岳阳楼记》,要训练机器标注该典籍中的形容词,就要首先训练相关人员标注形容词,在大量人工标注的基础上,再让机器学习。”这项坐冷板凳的基础标注工作一做就是10年之久。

王东波表示,我们期待能将古籍的智能化研究与跨学科的人才培养相结合,让学生既有前瞻的科研视野,又能积累较为深厚的人文底蕴,同时让更多受众接触古籍、品读古籍、传播古籍,真正地唤活“故纸堆”,共同推动中华优秀传统文化创造性转化和创新性发展,赓续传承中华文脉。

联合发布荀子古籍大语言模型的中华书局古联公司则主要致力于未来的场景应用和领域推广,荀子大模型除让大众用户能够顺畅利用古籍内容、在专业领域推动古籍整理、古籍数字化、古籍活化利用与传播之外,未来还可广泛应用于AI写作、AI教学、数字文娱等领域。

该成果依托国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”。在同步举行的古籍智能化研究与产业应用研讨会上,来自高校、出版界和互联网企业的与会专家学者分别立足于各自领域,围绕大模型在古籍整理、传统文化传承、数字化转型等方面的工作进行了深入探讨。

通讯员 楠秾宣

扬子晚报/紫牛新闻记者 王赟

校对 陶善工

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微信又上线新功能,聊天突然变了!
近日,微信突然因内测“访客记录”功能,引发全网关注。被内测到的用户,..
元宝可以总结微信聊天记录了
作者 | 黄昱元宝终于拆掉了微信最高的围墙。5月13日,腾讯旗下AI原生应用..
刚刚,微信聊天记录能喂给AI了!我让它爬楼、砍价、整理信息..
智东西作者 | 陈骏达编辑 | 心缘智东西5月13日报道,今天,腾讯宣布,微..
微信聊天出新功能了,快试试!
但要求你的手机安装有元宝App,这时就会跳转到元宝中进行粘贴,你可以发..
不用登你的微信,也能看到你的聊天记录!这几个地方一定赶紧删除..
你知道吗?其实不用登你的微信,也能看到你的聊天记录,是不是太可怕了?..
刚刚,微信聊天记录能喂给AI了,我让它爬楼、砍价、整理信息..
智东西5月13日报道,今天,腾讯宣布,微信已经支持将消息一键转发至元宝..
聊天总把天聊死?这7个雷区,你可能正在踩。如何正确和女生聊天..
明明聊得火热,为什么突然被拉黑?你可能踩中了这七个聊天雷区“在吗?”..
用ChatGPT看病,80%误诊:AI医生的9秒奇迹和80%的残酷真相..
9秒出CT报告,1分钟完成心脏诊断——AI医疗看起来像魔法。但哈佛刚说完:..
突发!OpenAI高层巨震,ChatGPT与CodeX或合并,超级AI来了!..
根据《连线》5 月 15 日的独家报道,在最新一轮组织调整中,OpenAI 总裁 ..
关于作者
无根草(普通会员)
文章
1919
关注
0
粉丝
2
点击领取今天的签到奖励!
签到排行

成员 网址收录40418 企业收录2986 印章生成263660 电子证书1157 电子名片68 自媒体110233

0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索