** Pyhton3中的pickle模块用于对Python****对象结构的二进制进行序列化(****或pickling)****和反序列化(****或unpickling)**。"pickling"是将Python对象及其所拥有的层次结构转化为一个字节流(byte stream)的过程,而"unpickling"是相反的操作,会将(来自一个binary file或者bytes-like object的)字节流转化回一个对象层次结构(object hierarchy)。
** **pickle是Python3的一个标准模块,安装Python3的同时就已经安装了pickle库。
** **pickle用于存储Python对象。我们不必一次又一次地构造同一个对象。我们将创建一次对象,然后将其保存到磁盘中,稍后,我们从磁盘加载此对象,而无需再次创建对象。
** **pickle在机器学习中最有用。机器学习模型是在非常大的数据集上训练的,训练模型会消耗大量时间。我们只需训练一次模型,然后可以将其保存到本地磁盘中,当我们需要测试我们的模型时,我们可以直接从磁盘加载它,而无需再次训练它。
** pickle模块并不安全**:你只应该对你信任的数据进行unpickle操作。在处理不信任数据时,更安全的序列化格式如json可能更为适合(json是一个文本序列化格式,而pickle是一个二进制序列化格式)。
** pickle所使用的数据格式仅可用于Python**。
** **如果我们试图unpickle在不同版本的Python生成的pickled文件,它可能会导致问题。如果你使用特定版本的Python pickled了一个对象,那么你可能无法使用低版本的Python来unpickle它。
** **尝试pickle不能被pickled的对象会抛出PicklingError异常,异常发生时,可能有部分字节已经被写入指定文件中。尝试pickle递归层级很深的对象时,可能会超出最大递归层级限制,此时会抛出RecursionError异常。在封存类的实例时,其类体和类数据不会跟着实例一起被pickled,只有实例数据会被pickled。
** **目前pickle模块可以使用六种不同的协议。协议版本越高,Python解释器就需要越新的版本才能进行unpickle。可通过pickle.HIGHEST_PROTOCOL获取当前python解释器支持的最高协议。要使用特定的协议,需要在调用load/loads/dump/dumps时指定协议版本。如果没有指定协议版本,那么解释器将使用pickle.DEFAULT_PROTOCOL属性中指定的默认版本。
** **要序列化某个包含层次结构的对象,只需调用dump或dumps函数即可。同样,要反序列化数据流,可以调用load或loads函数。dump和dumps函数之间的唯一区别是第一个创建一个序列化结果到打开的文件,而第二个把序列化结果到一个字符串。同样的概念也适用于load和loads函数:第一个读取打开的文件以启动unpickling过程,第二个对字符串进行unpickling操作。
** pickle支持pickled/unpickled****的对象,包括**:
** **(1).None,True,and False;
** **(2).integers,floating-point numbers,complex numbers;
** **(3).strings,bytes,bytearrays;
** **(4).tuples,lists,sets,and dictionaries containing only picklable objects;
** **(5).functions(built-in and user-defined) accessible from the top level of a module(using def,not lambda);
** **(6).classes accessible from the top level of a module;
** **(7).instances of such classes whose dict or the result of calling getstate() is picklable。
以上内容主要参考:https://docs.python.org/3/library/pickle.html
** **以下为测试代码:
import pickle
import sys
def dictionary_dump_load():
# reference: https://docs.python.org/zh-cn/3/library/pickle.html
data = {
'a': [1, 2.0, 3+4j],
'b': ("character string", b"byte string"),
'c': {None, True, False}
}
with open('data.pickle', 'wb') as f:
pickle.dump(data, f)
with open('data.pickle', 'rb') as f:
data2 = pickle.load(f)
print("dictionary data:", data2) # dictionary data: {'a': [1, 2.0, (3+4j)], 'b': ('character string', b'byte string'), 'c': {False, True, None}}
class example_class:
# reference: https://realpython.com/python-pickle-module/
a_number = 35
a_string = "hey"
a_list = [1, 2, 3]
a_dict = {"first": "a", "second": 2, "third": [1, 2, 3]}
a_tuple = (22, 23)
def donot_support_lambda():
square = lambda x : x * x # dill module support lambda serializes
my_pickle = pickle.dumps(square) # AttributeError: Can't pickle local object 'donot_support_lamda.<locals>.<lambda>'
def func_add(a, b):
return (a+b)
def main():
dictionary_dump_load()
my_object = example_class()
my_pickled_object = pickle.dumps(my_object) # Pickling the object
print(f"pickled object: {my_pickled_object}") # pickled object: b'\x80\x04\x95!\x00\x00\x00\x00\x00\x00\x00\x8c\x08__main__\x94\x8c\rexample_class\x94\x93\x94)\x81\x94.'
my_object.a_dict = None
my_unpickled_object = pickle.loads(my_pickled_object) # Unpickling the object
print(f"unpickled object: {my_unpickled_object.a_dict}") # unpickled object: {'first': 'a', 'second': 2, 'third': [1, 2, 3]}
# 可通过pickle.HIGHEST_PROTOCOL获取python解释器支持的最高协议,通过pickle.DEFAULT_PROTOCOL获取python解释器支持的默认协议
print(f"python version: {sys.version}, the highest protocol supported by the interpreter: {pickle.HIGHEST_PROTOCOL}") # python version: 3.10.4 (main, Mar 31 2022, 08:41:55) [GCC 7.5.0], the highest protocol supported by the interpreter: 5
print(f"python version: {sys.version}, default version: { pickle.DEFAULT_PROTOCOL}") # python version: 3.10.4 (main, Mar 31 2022, 08:41:55) [GCC 7.5.0], default version: 4
#donot_support_lambda()
# Python函数和类都可以序列化和反序列化
with open('data2.pickle', 'wb') as f:
pickle.dump(func_add, f) # dump function
with open('data2.pickle', 'rb') as f:
add = pickle.load(f)
print("2+3=", add(2, 3)) # 2+3= 5
print("test finish")
if __name__ == '__main__':
main()
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/fengbingchun/article/details/125584682
内容来源于网络,如有侵权,请联系作者删除!