SPLIT 运算符用于将关系拆分为两个或多个关系。
下面给出了 SPLIT 运算符的语法。
grunt> SPLIT Relation1_name INTO Relation2_name IF (condition1), Relation2_name (condition2),
假设在HDFS目录 /pig_data/ 中有一个名为 student_details.txt 的文件,如下所示。
student_details.txt
001,Rajiv,Reddy,21,9848022337,Hyderabad 002,siddarth,Battacharya,22,9848022338,Kolkata 003,Rajesh,Khanna,22,9848022339,Delhi 004,Preethi,Agarwal,21,9848022330,Pune 005,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar 006,Archana,Mishra,23,9848022335,Chennai 007,Komal,Nayak,24,9848022334,trivendram 008,Bharathi,Nambiayar,24,9848022333,Chennai
通过关系 student_details 将此文件加载到Pig中,如下所示。
student_details = LOAD 'hdfs://localhost:9000/pig_data/student_details.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, age:int, phone:chararray, city:chararray);
现在,让我们将关系分为两个,一个列出年龄小于23岁的员工,另一个列出年龄在22到25岁之间的员工。
SPLIT student_details into student_details1 if age<23, student_details2 if (22<age and age>25);
使用 DUMP 操作符验证关系 student_details1 和 student_details2 ,如下所示。
grunt> Dump student_details1; grunt> Dump student_details2;
它将产生以下输出,分别显示关系 student_details1 和 student_details2 的内容。
grunt> Dump student_details1; (1,Rajiv,Reddy,21,9848022337,Hyderabad) (2,siddarth,Battacharya,22,9848022338,Kolkata) (3,Rajesh,Khanna,22,9848022339,Delhi) (4,Preethi,Agarwal,21,9848022330,Pune) grunt> Dump student_details2; (5,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar) (6,Archana,Mishra,23,9848022335,Chennai) (7,Komal,Nayak,24,9848022334,trivendram) (8,Bharathi,Nambiayar,24,9848022333,Chennai)
简介Hadoop Distributed File System,分布式文件系统架构Block数据块;基本存储单位,一般大小为64M(配置大的块主要是因为:1)...
native-component原生组件小程序中的部分组件是由客户端创建的原生组件,这些组件有:cameracanvasinput(仅在focus时表现为原生...
wx.offVoIPChatInterrupted(function callback)基础库 2.9.0 开始支持,低版本需做兼容处理。取消监听被动断开实时语音通话事件...
关键词:case,选择器case语句是一种多路条件分支的形式,可以解决if语句中有多个条件选项时使用不方便的问题。case语句case语句...
Component(Object object)创建自定义组件,接受一个Object类型的参数。参数Object object定义段类型是否必填描述最低版本propert...
微信小程序form基础库 1.0.0 开始支持,低版本需做兼容处理。表单。将组件内的用户输入的switchinputcheckboxsliderradiopicker...
wx.saveVideoToPhotosAlbum(Object object)基础库 1.2.0 开始支持,低版本需做兼容处理。调用前需要用户授权scope.writePhotosAl...
Arduino - OverviewArduino是一个基于易于使用的硬件和软件的原型平台(开源)。 它包括一个可编程的电路板(称为微控制器)和一个称...
delayMicroseconds()函数接受单个整数(或数字)参数。此数字表示时间,以微秒为单位。一毫秒内有一千微秒,一秒内有一百万微秒...