炼数成金 门户 商业智能 自然语言处理 查看内容

乐府:基于GPT的中国古诗词生成系统

2019-9-5 14:57| 发布者: 炼数成金_小数| 查看: 7931| 评论: 0|来自: 诺亚实验室

摘要: 古人云:熟读唐诗三百首,不会写诗也会吟。华为诺亚方舟实验室最近的研究表明,古人诚不我欺也。中国古诗词意境深远、格律优美、朗朗上口,是中国文化中璀璨的明珠。但由于形式和内容上的严格要求,普通人很难掌握写 ...

工具 模型 数据分析 商业智能 ETL

古人云:熟读唐诗三百首,不会写诗也会吟。

华为诺亚方舟实验室最近的研究表明,古人诚不我欺也。

中国古诗词意境深远、格律优美、朗朗上口,是中国文化中璀璨的明珠。但由于形式和内容上的严格要求,普通人很难掌握写诗的技巧。

AI古诗词写作近年来成为很多研究者关注的话题,随着深度学习技术的成熟,出现了一些非常优秀的中国古诗词生成系统。

2018年,预训练语言模型在NLP领域取得了极大的成果,特别是GPT模型,在语言生成中表现出了优异的性能。

我们首次将GPT模型应用于中国古诗词生成,提出了基于GPT模型的中国古诗词生成方法。我们的研究发现,GPT模型在中国古诗词生成上表现极为出色。

我们首先利用大规模中文新闻语料训练得到一个中文GPT模型。然后我们对收集得到的大量中国古代诗歌、词、对联按照特定的格式进行整理,再将整理好的数据输入到GPT模型中进行微调(fine-tune),就得到了一个高质量的古诗词生成系统,我们将它命名为【乐府】。乐府系统能够按照格律要求生成非常高质量的古诗、词和对联。通过对训练数据的适当调整,我们还能够生成特定形式的藏头诗。

特别令人惊讶的是,我们对GPT模型没有进行任何定制修改,没有人工输入创作古诗所需要的字数、韵律、平仄、对仗等任何知识,没有定义任何这方面的特征,也没有输入任何人工编制的词典,系统完全从语料中学到了作诗能力,掌握了这些复杂的作诗技巧。

下面是乐府系统生成的一些诗词样例:

【乐府】对联样例(给出上联对下联):

注:严格来说,对联并不属于诗词。我们这里为简单起见,把对联也当成古诗词的一类。

【乐府】生成的近体诗样例:


【乐府】生成的词样例:


【乐府】生成的藏头诗样例:


下面是一些【乐府】小程序生成的诗歌截图:





关于该方法的更多细节请参考我们的论文:https://arxiv.org/abs/1907.00151。

声明:本文版权归原作者所有,文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括:各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-9-17 10:58 , Processed in 0.176673 second(s), 25 queries .