下面是我所拥有的数据和相同的模式是-学生姓名,问题编号,实际结果(或-错误/正确)
(b,q1,Correct)
(a,q1,false)
(b,q2,Correct)
(a,q2,false)
(b,q3,false)
(a,q3,Correct)
(b,q4,false)
(a,q4,false)
(b,q5,flase)
(a,q5,false)
我要做的是计算每个学生的正确答案和错误答案的总数,即a/b。
下面是我所拥有的数据和相同的模式是-学生姓名,问题编号,实际结果(或-错误/正确)
(b,q1,Correct)
(a,q1,false)
(b,q2,Correct)
(a,q2,false)
(b,q3,false)
(a,q3,Correct)
(b,q4,false)
(a,q4,false)
(b,q5,flase)
(a,q5,false)
我要做的是计算每个学生的正确答案和错误答案的总数,即a/b。
2条答案
按热度按时间bf1o4zei1#
使用此选项:
答案是:
希望这是你想要的产品
kcugc4gi2#
对于共享的用例,下面的pig脚本就足够了。
Pig脚本:
输入:student\ u data.csv:
输出:转储kpi:
参考:更多关于嵌套的细节
http://pig.apache.org/docs/r0.12.0/basic.html#foreach
http://chimera.labs.oreilly.com/books/1234000001811/ch06.html#more_on_foreach