Python Pandas值错误数组必须全部长度相同

w6lpcovy 于 2023-02-07 发布在 Python

关注(0)|答案(5)|浏览(352)

迭代一个大的.mp3链接列表以获取元数据标记并将其保存到Excel文件。导致此错误。感谢任何帮助。谢谢。

#print is_connected();

    # Create a Pandas dataframe from the data.
df = pd.DataFrame({'Links' : lines ,'Titles' : titles , 'Singers': finalsingers , 'Albums':finalalbums , 'Years' : years})

    # Create a Pandas Excel writer using XlsxWriter as the engine.
writer = pd.ExcelWriter(xlspath, engine='xlsxwriter')

    # Convert the dataframe to an XlsxWriter Excel object.
df.to_excel(writer, sheet_name='Sheet1')
    #df.to_excel(writer, sheet_name='Sheet1')

    # Close the Pandas Excel writer and output the Excel file.
writer.save()

Traceback (most recent call last):
  File "mp.py", line 87, in <module>
    df = pd.DataFrame({'Links' : lines ,'Titles' : titles , 'Singers': finalsingers , 'Albums':finalalbums , 'Years' : years})
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 266, in __init__
    mgr = self._init_dict(data, index, columns, dtype=dtype)
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 402, in _init_dict
    return _arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype)
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 5409, in _arrays_to_mgr
    index = extract_index(arrays)
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 5457, in extract_index
    raise ValueError('arrays must all be same length')
ValueError: arrays must all be same length

pandas

来源：https://stackoverflow.com/questions/40442014/python-pandas-valueerror-arrays-must-be-all-same-length

5条答案

按热度按时间

bybem2ql1#

您可以执行此操作以避免该错误

a = {'Links' : lines ,'Titles' : titles , 'Singers': finalsingers , 'Albums':finalalbums , 'Years' : years}
df = pd.DataFrame.from_dict(a, orient='index')
df = df.transpose()

- 说明：**

这将创建DataFrame，因为每个键（例如'Links'）是一行，这样丢失的值实际上是丢失的列，这对Pandas来说没有问题（只有丢失的行会在创建过程中导致ValueError）。之后，您将DataFrame转置（翻转轴），并将行转换为列，这将产生您最初想要的DataFrame。

赞(0）回复(0）举报 2023-02-07

os8fio9y2#

它告诉你数组（行，标题，最后的歌手，等等......）的长度不同。

print(len(lines), len(titles), len(finalsingers)) # Print all of them out here

这将显示哪些数据是错误的，然后您需要做一些调查，以正确的方式来纠正这一点。

赞(0）回复(0）举报 2023-02-07

cgvd09ve3#

可以用空元素填充最短的列表：

def pad_dict_list(dict_list, padel):
    lmax = 0
    for lname in dict_list.keys():
        lmax = max(lmax, len(dict_list[lname]))
    for lname in dict_list.keys():
        ll = len(dict_list[lname])
        if  ll < lmax:
            dict_list[lname] += [padel] * (lmax - ll)
    return dict_list

dict_list = {'Links': [1, 2, 3], 'Titles': [1, 2, 3, 4], 'Singers': [1, 2], 'Albums': [1, 2, 3], 'Years': [1, 2, 3, 4]}
dict_list = pad_dict_list(dict_list, 0)
print(dict_list)

产出

{'Links': [1, 2, 3, 0], 'Titles': [1, 2, 3, 4], 'Singers': [1, 2, 0, 0], 'Albums': [1, 2, 3, 0], 'Years': [1, 2, 3, 4]}

赞(0）回复(0）举报 2023-02-07

icnyk63a4#

重复的变量名导致了这个问题

赞(0）回复(0）举报 2023-02-07

m2xkgtsf5#

我在阅读JSON文件到Pandas框架时遇到了同样的错误。添加linesbool，默认False参数解决了这个问题。

StringData = StringIO(obj.get()['Body'].read().decode('utf-8'))
                mydata = pdf.read_json(StringData, lines=True)

赞(0）回复(0）举报 2023-02-07

我来回答

Python Pandas值错误数组必须全部长度相同

5条答案

相关问题

热门标签

最新问答