Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

出荷遅延の予測

With the inception of one-day and same-day delivery, customer standards on punctuality and speed have risen to levels unlike ever before. While a delayed delivery will usually be only a nuisance to the individual consumer, demands for speed ultimately flow upstream into the supply chain, where retailers and manufacturers are constantly being pressed on time. For these organizations, on-time performance is a matter of millions of dollars of customer orders or contractual obligations. Unfortunately, with the unavoidable challenges that come with managing variability in the supply chain, even the most well-known logistics carriers saw a 6.9 percent average delay across shipments made by 100 e-commerce retailers who collectively delivered more than 500,000 packages in the first quarter of 2019.

Sample training data used in this use case, "Supply Chain Shipment Pricing Data":

ここをクリックすると、データの操作から始まる実践的なセクションに直接ジャンプします。 それ以外の場合は、次のいくつかの項で、このユースケースのビジネス上の正当な理由と問題の枠組みについて説明します。

ビジネス上の問題

サプライチェーンネットワークの重要な要素は、特に土壇場で発生した場合の部品不足を防ぐことです。 部品が不足すると、機械や輸送が十分に活用されないだけでなく、ネットワーク全体での配送が遅れるというドミノ効果が発生します。 さらに、時間どおりに到着する部品の予測数と実際の数の不一致により、サプライチェーンマネージャーは材料計画を最適化できません。

遅延がサプライチェーンに与える影響を軽減するために、製造業者は、過剰在庫の保有、さらに標準化するための製品設計の最適化、単一調達戦略からの脱却などのアプローチを採用しています。 ただし、これらのアプローチのほとんどは、部品、保管、およびロジスティクスに不要なコストをもたらします。

多くの場合、サプライチェーンマネージャーが根本原因を判断し、将来発生しないように短期的および長期的な調整を実施できるようになるまで、出荷の遅延が続きます。 残念ながら、サプライチェーンマネージャーは、時間とリソースが限られているため、MRPシステムで利用可能な履歴データを効率的に分析することができませんでした。

ソリューションの価値

AI helps supply chain managers reduce parts shortages by predicting the occurrence of late shipments, which in turn gives them time to intervene. By learning from past cases of late shipments and their associated features, AI applies these patterns to future shipments to predict the likelihood that those shipments will also be delayed. Unlike complex MRP systems, AI provides supply chain managers with the statistical reasons behind each late shipment in an intuitive but scientific way. For example, when AI notifies supply chain managers of a late shipment, it will also explain why, offering reasons such as the shipment’s vendor, mode of transportation, or country.

Using this information, supply chain managers can apply both-short term and long-term solutions to preventing late shipments. In the short term, based on their unique characteristics, shipment delays can be prevented by adjusting transportation or delivery routes. In the long term, supply chain managers can conduct aggregated root-cause analyses to discover and solve the systematic causes of delays. They can use this information to make strategic decisions, such as choosing vendors located in more accessible geographies or reorganizing shipment schedules and quantities.

ROIによる見積もり

このソリューションを実装するためのROIは、次の要因を考慮して見積もることができます。

  • Starting with the manufacturing company and production line stoppage, the cycle time of the production process can be used to understand how much of the production loss relates to part shortages. たとえば、サイクルタイム(1つの部品を完成するのにかかる時間)が60秒で、部品不足が原因で毎日15分生産ラインがストップすると、15分の生産量低減は15個の製品に相当します。 同様の計算を使用して、部品不足による年間損失を見積もることができます。

  • For a logistic provider, predicting part shortages early can increase savings in terms of reduced inventory. これは、AIソリューションの導入前と導入後で部品在庫の維持数がどのように変わったかを検出することで大まかに見積もることができます。 単位あたりの保有コストと在庫コストを掛けたときの在庫の差異が、全体的なROIを示します。 さらに、部品の需要が(部品不足のために)満たされないままになっている場合、充足されない需要に関連する機会費用は、それに対応するビジネスチャンスの損失に直結します。

データ

This accelerator uses a publicly-available dataset, provided by the President’s Emergency plan for AIDS relief (PEPFAR), to represent how a manufacturing or logistics company can leverage AI models to improve decision-making. このデータセットには、サプライチェーンの健全な商品の出荷と価格のデータが含まれます。 具体的には、抗レトロウイルス薬(ARV)とHIVラボからの支援対象国への出荷を特定できます。 さらに、このデータセットには、商品の価格設定と、商品を他国に出荷して使用するために必要な関連サプライチェーンの費用が含まれています。

特徴量とサンプルデータ

The features in the dataset represent some of the factors that are important in predicting delays.

ターゲット

ターゲット特徴量:

  • Late_delivery

This feature represents whether or not a shipment would be delayed using values such as True \ False, 1 \ 0, etc. This choice in target makes this a binary classification problem. ターゲット特徴量の分布は不均衡で、11.4%が1(遅れた配送)で、88.6%が0(予定どおりの配送)です。

サンプル特徴量セット

The following shows sample features for this use case:

特徴量名 データ型 説明 データソース
Vendor カテゴリー 配送品を出荷するベンダーの名前。 注文書 ランバクシー社、サンファーマ社など
Item description テキスト Details of the part/item that is being shipped 注文書 30mg HIV検査キット、600mgラミブジンカプセル
Line item quantity 数値 注文された製品の数量。 注文書 1000、300など
ライン項目の値 数値 注文したライン項目の単価。 注文書 0.39, 1.33
製造現場 カテゴリー 製造を行ったベンダーの拠点(同じベンダーでも複数の異なる拠点から部品を出荷できるため)。 請求書 Sun Pharma, India
Product group カテゴリー 注文された製品のカテゴリー。 注文書 HRDT, ARV
Shipment mode カテゴリー 部品配送のための搬送方法。 請求書 航空、トラック
Late delivery ターゲット(二値分類) Whether the delivery was late or on-time ERPシステム、発注書 0または1

In addition to the features listed above, incorporate any additional data that your organization collects that might be relevant to delays. (DataRobot is able to differentiate important/unimportant features if your selection would not improve modeling.) These features are generally stored across proprietary data sources available in the ERP systems of the organization.

データプレパレーション

データセットには、調達取引に関する履歴情報が含まれています。 データセット内の分析の各行は、個々の注文であり、その配達を予測する必要があります。 すべての注文には配達予定日と実際の配達日があり、これらの差異を使用してターゲット特徴量(Late_delivery)を定義します。 配達日が予定日を過ぎた場合、ターゲット特徴量の値は1になり、それ以外の場合は0なります。 全体として、データセットにはターゲット特徴量を含めて、約10,320行と26の特徴量が含まれています。

モデリングとインサイト

DataRobotでは、 ここで説明するように、データセットの処理や分割など、モデリングパイプラインの多くの部分が自動化されます。

While this use case skips the modeling section and moves straight to model interpretation, it is worth noting that because the dataset is imbalanced, DataRobot automatically recommends using LogLoss as the optimization metric to identify the most accurate model, being that it is an error metric which penalizes wrong predictions.

このデータセットの場合は、オープンソースのXGboostライブラリーを使用する教師無し学習による特徴量を用いたExtreme Gradient Boosting Tree Classifierが、最も精度の高いモデルとして検出されました。

The following sections describe the insights available after a model is built.

特徴量のインパクト

モデルの仕組みを明確化するために、DataRobotはグローバルレベルとローカルレベルの両方のモデルを説明します。 Feature Impact shows, at a high level, which features are driving model decisions (the relative importance of the features in the dataset in relation to the selected target variable).

ご覧のとおり、Pack PriceCountryVendorVendor INCO TermおよびLine item Insuranceのモデルが部品出荷の遅延に影響を与える最も重要な要因の一部として特定されました。

予測の説明

DataRobot also provides Prediction Explanations to help understand the 10 key drivers for each prediction generated. これにより、不足する部品ごとの固有の事情に合わせて措置をきめ細かく調整できるようになります。

たとえば、特定の国が主な出荷遅延の原因である場合、これらの国のベンダーと連絡を取り、出荷ルート全体を綿密に監視する措置を取れます。

同様に、遅延の上位の理由として特定のベンダーが検出されている場合、それらのベンダーに前もって働き掛け、サプライチェーンネットワークに影響を及ぼすような出荷の遅れを回避するための是正措置を実施できます。 これらのインサイトは、新しいルールや代替の購買先を組み込んでサプライチェーンプロセスを改善するという、意思決定をデータに基づいて行えるようになります。

ワードクラウド

For text variables, such as Part description in the included dataset), use Word Clouds to discover the words or phrases that are highly associated with delayed shipments. テキスト特徴量のモデリングは一般に最も難しく、時間がかかります。DataRobotでは、それぞれのテキスト列が個々の分類器として自動的に機能し、NLP手法(tf-idf、nグラムなど)で直接前処理されます。この場合、nevirapine 10 mgという表される品目がそれ以外の品目に比べて遅延する可能性が高いことがわかります。

精度の評価

DataRobotはモデルのパフォーマンスを評価するにあたって、デフォルトで5分割交差検定を実行しました。出力されたAUCスコア(ROC曲線)はおよそ0.82でした。ホールドアウトセット(目に見えないデータ)に対するAUCスコアもおよそ0.82のため、モデルの一般化は良好で過剰適合していないことが確認できます。 モデルの評価でAUCスコアを調べる理由は、AUCは実測値を調べるのではなく出力(つまり、出荷遅延の確率)のランク付けを行うからです。 以下のリフトチャートでは、データを予測値で並べ替えた場合の予測値(青い線)と実測値(赤い線)が比較されています。 遅延する可能性が高い注文でやや予測値のほうが低くなっています。 ただし、全体としては、モデルのパフォーマンスは良好です。 Furthermore, depending on your ultimate problem framework, you can review the Confusion Matrix for the selected model and, if required, adjust the prediction threshold to optimize for precision and recall.

予測とデプロイ

モデルを選択したら、目的の意思決定環境にデプロイできます。 意思決定環境とは、モデルで生成された予測結果を組織内の適切な関係者が使用する方法、およびそれらの関係者がその予測値に基づいて全体のプロセスに影響する意思決定を行う方法を指します。

このユースケースによる予測は、サプライチェーンマネージャーがロジスティクスに近い将来遅延が生じるかどうかを予想して行う意思決定を強化します。 マネージャーの意思決定と組み合わせると、サプライチェーンネットワーク全体の改善に役立つインテリジェントなマシンとして機能します。

意思決定の関係者

The following table lists potential decision stakeholders

利害関係者 説明
意思決定の実行者 Supply chain managers and procurement teams who are empowered with the information they need to ensure that the supply chain network is free from bottlenecks. これらの担当者は、ベンダーと強力な関係を持ち、モデルの予測を使用して是正措置を実施できます。
意思決定の管理者 Executive stakeholders who manage large-scale partnerships with key vendors. これらの利害関係者は、全体的な結果に基づいて、ベンダーとの関係の健全性を四半期ごとに確認し、長期的な投資とビジネスパートナーシップに関する戦略的決定を下すことができます。
意思決定の作成者 Business analysts or data scientists who would build this decision environment. これらのアナリストは、普段サプライチェーンマネージャーとそのチームと連携して働いている、社内のサプライチェーンチーム、エンジニアリングチーム、ベンダー開発チームに所属するエンジニアやアナリストが該当します。

モデルデプロイ

DataRobot予測APIを使用して、モデルをデプロイできます。 A REST API endpoint can bounce back predictions in near real time when new scoring data from new orders are received.

AIアプリ

モデルが(組織が決定した方法で)デプロイされると、いくつかの方法で予測を使用できます。 For example, a front-end application that acts as the supply chain’s reporting tool can be used to deliver new scoring data as an input to the model, which then returns predictions and Prediction Explanations in real-time for use in the decision process. たとえば、この AIアプリは、ノーコードインターフェイスを使用して、簡単に共有できるAI搭載のアプリケーションです。

意思決定プロセス

マネージャーや経営陣の関係者が、潜在的なボトルネックを特定するための予測結果とPrediction Explanationsに基づいて下す意思決定は、サプライチェーンネットワーク内の該当するベンダーチームにまで影響し、データに基づくインサイトに応じたコラボレーションを促進するでしょう。 意思決定は、部品不足がビジネスに与える影響の重大度に応じて、長期的なものにも短期的なものにもなり得ます。

Monitoring and management

製品ライフサイクル管理と同様に、モデルの健全性の追跡は、適切なモデルライフサイクル管理に非常に重要です。 MLOpsを使用すると、一元化されたプラットフォームを通じて組織全体のすべてのモデルをデプロイ、監視、および管理できます。

実装に関する考慮事項

このソリューションを実業務に導入する際の大きなリスクの1つは、現場レベルでの導入方法です。 ベンダーとの間に強力で透明性の高い関係があることも、是正措置を講じる上で決定的に重要です。 ベンダー側にモデルの予測結果を信頼してデータに基づく戦略を採用する準備ができていない場合に、リスクが生じます。


更新しました July 30, 2024