我的问题是-使用NumPy函数np.random.randn生成100,000个点的正态分布的数据x。然后绘制直方图。我的计算是-
x = sp.norm.pdf(np.random.randn(100000)) plt.hist(x, bins = 20, facecolor='blue', alpha=0.5)
字符串是不是有什么问题,因为我不能得到正态分布的直方图?
yh2wf1be1#
要从标准正态分布中获得N个随机样本,您可以使用np.random.randn(N)或scipy的stats.norm.rvs(size=N)。然后可以使用这些样本创建直方图。要绘制曲线,可以使用stats.norm.pdf(y),其中y是后续x值的数组。这样的pdf是标准化的,即图下的面积为1。直方图的总面积是样本数乘以箱宽(每个样本福尔斯正好落在一个bin中)。因此,将pdf与该因子相乘将使其缩放到直方图的高度。stats.norm.pdf(np.random.randn(N))的结果将是N个随机样本的概率列表。大多数样本将在曲线的中心附近结束(在y = 0处),PDF的高度约为0.40。这解释了最大值附近的高峰。
np.random.randn(N)
stats.norm.rvs(size=N)
stats.norm.pdf(y)
y
pdf
stats.norm.pdf(np.random.randn(N))
y = 0
0.40
import numpy as np import matplotlib.pyplot as plt from scipy import stats N = 100000 # x = np.random.randn(N) x = stats.norm.rvs(size=N) num_bins = 20 plt.hist(x, bins=num_bins, facecolor='blue', alpha=0.5) y = np.linspace(-4, 4, 1000) bin_width = (x.max() - x.min()) / num_bins plt.plot(y, stats.norm.pdf(y) * N * bin_width) plt.show()
字符串
的数据
cgh8pdjw2#
import numpy as np import matplotlib.pyplot as plt x = np.random.randn(100_000) plt.hist(x, bins=20, facecolor="blue", alpha=0.5) plt.show()
sgtfey8w3#
import numpy as np import seaborn as sns N = 1000 x = np.random.randn(N) sns.histplot(x,bins=20,kde=True,color='red')
3条答案
按热度按时间yh2wf1be1#
要从标准正态分布中获得N个随机样本,您可以使用
np.random.randn(N)
或scipy的stats.norm.rvs(size=N)
。然后可以使用这些样本创建直方图。要绘制曲线,可以使用
stats.norm.pdf(y)
,其中y
是后续x值的数组。这样的pdf
是标准化的,即图下的面积为1。直方图的总面积是样本数乘以箱宽(每个样本福尔斯正好落在一个bin中)。因此,将pdf与该因子相乘将使其缩放到直方图的高度。stats.norm.pdf(np.random.randn(N))
的结果将是N个随机样本的概率列表。大多数样本将在曲线的中心附近结束(在y = 0
处),PDF的高度约为0.40
。这解释了最大值附近的高峰。字符串
的数据
cgh8pdjw2#
的数据
字符串
sgtfey8w3#
字符串
的数据