我有一个sql Group By
我想找到 substationcode
以及 substationname
以记录计数。
使用正确的 Group By
,我应该能够看到具有不同计数的记录 substationcode
+ substationname
组合。
例如:
Source table:
substationcode substationname
ANDY SUB:ANDY LAU
ANDY SUB:CONS ANDY LAU
ACHM SUB:ACHM
MIA SUB:MIA LEONG
JON SUB:JON LEE
这是我的密码:
proc sql;
create table twolayers as
select substationcode
,
substationname
,count(substationname) as cnt
from onlyscadadomsdistinct
group by substationcode, substationname
having cnt >1;
quit;
我希望得到的结果是安迪的cnt=2。然而,我看到achm有记录的cnt为4。我不明白。我的小组中哪一部分是错的?
然后我过滤 substationcode
“achm”看到了 substationname
关于“achm”。
只找到1条记录sub:achm
achm cnt=4来自哪里?
1条答案
按热度按时间bvpmtnay1#
只能按以下方式选择和分组substationcode:
选择子站代码
,按cnt>1的substationcode从onlyscadadomsdistinct组中将(substationcode)计数为cnt;