覆盖主要内容
版本: 下个版本

简繁转换

组件介绍

**“简繁转换”(Chinese Conversion)**控件主要用于对文本中的中文进行简繁互转的操作。


  • 输入:
    • text: 文本数据集
  • 输出:
    • text:简繁转换后的文本数据集

**“简繁转换”(Chinese Conversion)**控件读取文本数据集,只对文本数据集中的train.txt文件进行转换,根据配置信息进行中文简繁转换。 数据集目录结构如下:

|- train.txt

train.txt用于记录训练集数据信息,包括源语言和目标语言,其中第一列为详细文本(text);第二列为摘要文本(summary),数据集要求列名固定,两列之间以\t为分隔符,train.txt内容示例如下:

#影像志#【北京惊现“秒杀Google的办公室”】 到办公室上班还能攀岩、滑滑梯、带宠物,办公楼有热带雨林、露天烧烤台、吧台,还有跑步机、乒乓球台、羽毛球馆。近日在网上晒出一组某办公室的图片,实在让人羡慕!这是真的吗?这样的上班地点可以有啊。

页面介绍

点击**“简繁转换”(Chinese Conversion)**控件查看参数配置页面,如下图所示:

参数选项

选项说明取值范围样例值
模型选择

中文简繁转换模型

简转繁
繁转简

简转繁

使用案例

在下图所示的案例中,使用**“文本”(Text)控件加载数据集,连接“简繁转换”(Chinese Conversion)控件对文本中的简体中文进行简繁转换,再将“简繁转换”(Chinese Conversion)控件与“文件保存”(Save File)**控件连接起来保存转换结果。

案例中控件执行结果如下图所示: