Pig Latin的 BagToString() 函数用于将包的元素连接成字符串。在连接时,我们可以在这些值之间放置分隔符(可选)。通常,包是无序的,可以使用 ORDER BY 运算符排序。
下面给出了 BagToString() 函数的语法。
grunt> BagToString(vals:bag [, delimiter:chararray])
假设在HDFS目录 /pig_data/ 中有一个名为 date of birth.txt 的文件,如下所示。 此文件包含出生日期。
dateofbirth.txt
22,3,1990 23,11,1989 1,3,1998 2,6,1980 26,9,1989
通过关系 dob 将这个文件加载到Pig中,如下所示。
grunt> dob = LOAD 'hdfs://localhost:9000/pig_data/dateofbirth.txt' USING PigStorage(',') as (day:int, month:int, year:int);
使用 bagtostring() 函数,我们可以将bag中的数据转换为字符串。让我们将 dob 关系分组,组操作将生成含有关系的所有元组的包。
使用Group All运算符将关系 dob 分组,并将结果存储在名为 group_dob 的关系中,如下所示。
grunt> group_dob = Group dob All;
它将产生如下所示的关系。
grunt> Dump group_dob; (all,{(26,9,1989),(2,6,1980),(1,3,1998),(23,11,1989),(22,3,1990)})
在这里,我们可以观察到一个有所有出生日期的包作为它的元组。现在,让我们使用函数 BagToString() 将包转换为字符串。
grunt> dob_string = foreach group_dob Generate BagToString(dob);
使用 DUMP 运算符验证关系 dob_string ,如下所示。
grunt> Dump dob_string;
它将产生以下输出,显示关系 dob_string 的内容。
(26_9_1989_2_6_1980_1_3_1998_23_11_1989_22_3_1990)
此函数用于将给定字符串的第一个字符转换为小写。语法以下是 LCFIRST()函数的语法。grunt LCFIRST(expression) 例假设在 HDFS 目...
此函数接受日期时间对象作为参数,并返回给定日期时间对象的当前秒的毫秒数。语法这是 GetMilliSecond()函数的语法。grunt Get...
此函数接受两个日期时间对象,并计算两个给定日期时间对象之间的小时数。语法这是 HoursBetween()函数的语法。grunt HoursBetwee...
databaseAdd本接口应在服务器端调用,详细说明参见服务端API。数据库插入记录请求地址POST https://api.weixin.qq.com/tcb/datab...
CloudPay.refund()支持端:云函数 2.0.2申请退款说明当交易发生之后一段时间内,由于买家或者卖家的原因需要退款时,卖家可以通...
获取二维码通过后台接口可以获取小程序任意页面的二维码,扫描该二维码可以直接进入小程序对应的页面。目前微信支持两种二维码,...
analysis.getVisitPage本接口应在服务器端调用,详细说明参见服务端API。本接口支持云调用。需开发者工具版本 =1.02.1904090(最...