SplitRecord
分割输入数据流
参数说明
读取服务
指定读取数据流内容的数据格式
写入服务
指定输出内容的数据格式
拆分记录条数
指定分割完后一个数据流包含的记录条数
输出连线
- failure连线表示分割失败的数据流输出
- splits连线表示分割成功的数据流输出
- original连线表示分割成功后原始的数据流输出
示例
GenerateFlowFile配置
为避免生成过多数据,将组件”调度“中的”运行安排“设置为7 days
。
再将”自定义文本“设置为:
ID,USERNAME,NAME,AGE,BIRTHDAY
1,zhangsan1,张三,20,1998-08-01 00:00:00.0
2,lisi,李四,21,1997-08-01 00:00:00.0
3,wangwu,王五,33,1985-08-08 00:00:00.0
4,zhaosi,赵四,45,1973-08-01 00:00:00.0
5,zhaosi,赵四,43,1975-08-01 00:00:00.0
6,qiansheng,钱生,43,1975-08-01 00:00:00.0
7,zhaoai,赵爱,43,1975-08-08 00:00:00.0
8,zhaotang,赵唐,33,1985-09-01 00:00:00.0
9,zhaosi,赵四,45,1973-09-09 00:00:00.0
10,zhaoai,赵爱,43,1975-09-01 00:00:00.0
11,zhaobi,赵璧,45,1973-02-03 00:00:00.0
12,zhaori,赵日,44,1974-03-03 00:00:00.0
13,zhaosi,赵四,45,1973-09-09 00:00:00.0
14,zhaotang,赵唐,33,1985-09-09 00:00:00.0
15,zhaotc,赵唐,43,1975-09-01 00:00:00.0
流程说明
在此流程中会通过读取CSV数据,将其转换为JSON输出,在此同时,会分割数据,分别将每一条记录作为JSON对象输出
SplitRecord设置
以将CSV分割为JSON为例,设置了读取服务
为CSV读取控制器服务,写入服务
为JSON输出控制器服务,拆分记录条数
为1。
结果
最后输出结果如下:
- success连线输出结果
- original连线输出结果
流程模板
参见附件(请右键另存保存):模板文件