我正在使用pyspark df,如下所示:
+-------------+-----+-----+------+
| words| A| B| C|
+-------------+-----+-----+------+
| write| 1.0|2.083| 2.083|
| trade|0.485|4.148| 2.012|
| elite|0.333|5.969| 1.988|
| mark| 0.5|3.897| 1.949|
| quot|0.439|4.227| 1.856|
| prostate| 0.25|7.416| 1.854|
| maya| 0.25|7.416| 1.854|
| lafayette|0.222|8.109| 1.8|
| detail| 1.0|1.789| 1.789|
| punta| 0.2|8.802| 1.76|
|scorbutically| 0.2|8.802| 1.76|
df.dtypes
[('words', 'string'),
('A', 'double'),
('B', 'double'),
('C', 'double')]
我想做一个专栏文章 words
基于列的值 C
也就是说,c栏中的值越高的词应该看起来越大,这反映了它们的使用频率。
有可能吗?
有什么建议吗?
1条答案
按热度按时间9w11ddsr1#
您可以尝试: