三角分布の世界を広げるNumPy random.Generator.triangular()：応用例とサンプルコード付き

NumPy の random.Generator.triangular() 関数は、三角分布に従って乱数を生成するために使用されます。三角分布は、下限 left、最頻値 mode、上限 right を持つ連続確率分布です。

この関数は、以下の引数を取ります。

size: 出力形状 (int または tuple of ints、オプション)
right: 上限 (float または array_like)
mode: 最頻値 (float または array_like)
left: 下限 (float または array_like)

size が None の場合、left、mode、right がすべてスカラーの場合、単一の値が返されます。それ以外の場合は、np.broadcast(left, mode, right).size サンプルが抽出されます。

三角分布とは？

三角分布は、以下の確率密度関数を持つ連続確率分布です。

P(x; left, mode, right) = {
    0  if x < left or x > right
    (x - left) / (mode - left)  if x <= mode
    (right - x) / (right - mode)  if x > mode
}

この分布は、下限 left で始まり、最頻値 mode でピークに達し、上限 right で終わります。

コード例

以下のコード例は、random.Generator.triangular() 関数を使用して、三角分布に従って 10 個の乱数を生成する方法を示しています。

import numpy as np

# 乱数ジェネレータを作成
rng = np.random.default_rng()

# 三角分布から 10 個の乱数を生成
samples = rng.triangular(left=1, mode=5, right=10, size=10)

# 結果を出力
print(samples)

このコードを実行すると、以下のような出力が得られます。

[1.80048174 4.92336711 7.98921342 2.58037982 6.39068677 5.74349581
 8.87013719 3.89480676 9.94581106 1.20536934]

応用例

三角分布は、様々な場面で使用されます。例えば、

顧客の購買額のシミュレーション
製造品の重量のモデリング
プロジェクトの完了時間の推定

などがあります。

この関数は、並列化とベクトル化が可能です。
random.Generator.triangular() 関数は、他の三角分布ライブラリと互換性のある乱数を生成します。

基本的な例

import numpy as np

rng = np.random.default_rng()
samples = rng.triangular(left=1, mode=5, right=10, size=10)
print(samples)

特定の範囲の乱数を生成

この例は、random.Generator.triangular() 関数を使用して、特定の範囲の乱数を生成する方法を示しています。例えば、2 から 8 の間の乱数を生成するには、以下のコードを使用します。

import numpy as np

rng = np.random.default_rng()
samples = rng.triangular(left=2, mode=5, right=8, size=10)
print(samples)

配列を生成

この例は、random.Generator.triangular() 関数を使用して、配列を生成する方法を示しています。

import numpy as np

rng = np.random.default_rng()
left = np.array([1, 2, 3])
mode = np.array([5, 6, 7])
right = np.array([10, 11, 12])
samples = rng.triangular(left=left, mode=mode, right=right)
print(samples)

シード値を設定

この例は、random.Generator.triangular() 関数を使用して、シード値を設定する方法を示しています。シード値を設定することで、同じ乱数列を繰り返し生成することができます。

import numpy as np

rng = np.random.default_rng(seed=12345)
samples = rng.triangular(left=1, mode=5, right=10, size=10)
print(samples)

import numpy as np

def custom_triangular(left, mode, right, size):
    rng = np.random.default_rng()
    samples = rng.triangular(left=left, mode=mode, right=right, size=size)
    # カスタム処理をここで実行
    return samples

left = np.array([1, 2, 3])
mode = np.array([5, 6, 7])
right = np.array([10, 11, 12])
samples = custom_triangular(left=left, mode=mode, right=right, size=(10, 3))
print(samples)

コードを実行する前に、NumPy がインストールされていることを確認してください。

手動実装

三角分布の確率密度関数を直接使用して、手動で乱数を生成することができます。この方法は、柔軟性と制御性に優れていますが、計算量が多くなります。

import numpy as np

def triangular_pdf(x, left, mode, right):
    if x < left or x > right:
        return 0
    elif x <= mode:
        return (x - left) / (mode - left)
    else:
        return (right - x) / (right - mode)

def triangular_rng(left, mode, right, size):
    samples = np.empty(size)
    for i in range(size):
        while True:
            u = np.random.random()
            v = np.random.random()
            if v <= triangular_pdf(left, mode, right):
                samples[i] = left + (right - left) * u
                break
    return samples

left = 1
mode = 5
right = 10
size = 10
samples = triangular_rng(left, mode, right, size)
print(samples)

利点

他のライブラリに依存しない
柔軟性と制御性に優れている

欠点

計算量が多い

三角分布を生成するためのライブラリは他にもいくつかあります。例えば、SciPy、Statsmodels、PyGIST などがあります。これらのライブラリは、NumPy の実装よりも高速で効率的な場合がありますが、追加のインストールが必要になる場合があります。

import scipy.stats as stats

left = 1
mode = 5
right = 10
size = 10
samples = stats.triang.rvs(left, mode, right, size=size)
print(samples)

利点

追加機能を提供している場合がある
NumPy の実装よりも高速で効率的な場合がある

欠点

追加のインストールが必要になる場合がある

近似分布

三角分布と似たような性質を持つ他の分布を使用することができます。例えば、ベータ分布やガンマ分布は、パラメータを調整することで三角分布に近似させることができます。

import numpy as np
from scipy.stats import beta

left = 1
mode = 5
right = 10
size = 10

# ベータ分布を使用して三角分布を近似
alpha = (mode - left) * (right - mode) / ((right - left) ** 2)
beta = alpha
samples = beta.rvs(alpha, beta, size=size) * (right - left) + left
print(samples)

利点

三角分布を生成できない場合に役立つ

欠点

精度が低い場合がある

最適な代替方法の選択

最適な代替方法は、状況によって異なります。以下の要素を考慮する必要があります。

機能: 追加機能が必要かどうか
依存関係: 追加のライブラリをインストールする必要があるかどうか
計算速度: 乱数を生成するのにどれくらいの時間がかかるか
精度: 三角分布をどれだけ正確に近似する必要があるか