paulwong

PIG小议

什么是PIG
是一种设计语言,通过设计数据怎么流动,然后由相应的引擎将此变成MAPREDUCE JOB去HADOOP中运行。
PIG与SQL
两者有相同之处,执行一个或多个语句,然后出来一些结果。
但不同的是,SQL要先把数据导到表中才能执行,SQL不关心中间如何做,即发一个SQL语句过去,就有结果出来。
PIG,无须导数据到表中,但要设计直到出结果的中间过程,步骤如何等等。

posted on 2013-04-05 21:33 paulwong 阅读(282) 评论(0)  编辑  收藏 所属分类: 分布式HADOOP云计算PIG


只有注册用户登录后才能发表评论。


网站导航: