我想创建一个频率分布矩阵
1.Create a matrix.**Is it possible to get this in separate columns**
customer1 p1 p2 p3
customer 2 p2 p3
customer 3 p2 p3 p1
customer 4 p2 p1
2. Then I have to count the number of products that come together the most
For eg
p2 and p3 comes together 3 times
p1 p3 comes 2 times
p1 p2 comes 2 times
I want to recommend products to customers ,frequency of products that comes together
select customerId,product,count(*) from sales group by customerId,product
有人能帮我解决这个问题吗
7条答案
按热度按时间wb1gzix01#
--------3
薯片|焦炭
eivgtgni2#
--------1
可口可乐糖果
6ojccjat3#
数组
多列
这将返回整个产品组合的频率。
在你的例子中
(p1,p2,p3)
是最常见的(出现两次)。(p1,p2)
只出现一次(p2,p3)
.有关元组的频率,请参见@gordonlinoff answer。
m2xkgtsf4#
如果您需要客户购买的成对产品,则可以使用自联接:
通过使用更多的连接,可以将其扩展到两个以上的产品。
i86rm4rw5#
------1
上述结果的解释:
大多数情况下,3次,客户只购买可乐
接下来,有两次顾客买了薯片和可乐
曾经有个顾客只买芯片
有一次一个顾客买了一瓶可乐和糖果
9udxz4iz6#
--------2
芯片
gjmwrych7#
我知道光标已经不再是这个月的特色了,但我仍然不时地发现它们非常有用
下面的代码创建一个表变量,然后循环遍历销售数据,找出最常一起销售的产品组合
这将产生以下结果:
组合名称------组合基金
焦炭