我有一个NumPy数据集,其中包含句子ID和descriptions值。我想创建一个所需格式的有序列表,该格式为... [['value'], ['value']]
,仅包含描述值。新列表的顺序必须与原始列表的顺序保持相同,以便稍后将其与ID匹配。
我的问题是,我不能实现所需的格式为新的列表,而不是[['value'], ['value']]
我得到['value', 'value']
,为什么?
这就是我所尝试的:
原始输入数据:
[
[UUID('11ea1bca-eb95-4dc8-8cb9-c7d70a806679') 'the quick brown fox']
[UUID('339619ab-bd17-401f-82c8-a927145d52cf')' jumps over the lazy dog']
]
创建了一个仅存储描述值的新数组:
description = np.array([description[1] for description in chunk])
但是,这会产生以下输出:
['the quick brown fox','jumps over the lazy dog']
我想要的输出是:
[['the quick brown fox'],[jumps over the lazy dog']]
我如何在保持原始顺序的情况下实现所需的输出?
- 使用Python 3.8
- 原始列表来自
np.array_split(book_information, chunk_size)
,我在其中逐块循环
1条答案
按热度按时间lf3rwulv1#
您可以在定义数组时加入其他维度:
description = np.array([[description[1]] for description in chunk])
.