ギリシャの研究者らは、ローカル モデルの更新を中央サーバーに送信して修正する機械学習手法であるフェデレーテッド ラーニングを使用して、プロシューマー スキーム向けの PV 予測技術を開発しました。彼らのシミュレーションでは、集中型の予測と比較して驚くべき結果が示されています。
画像: Blue Coat Photos、Flickr、CC BY-SA 2.0
ギリシャのアテネ国立工科大学の科学者らは、プロシューマーのプライバシーを保護する新しい PV 予測技術を提案しました。効率的なプロシューマー スキームは、正確な太陽光発電予測モデルに依存しますが、これには膨大なデータが必要であり、プライバシーと実用性のトレードオフが不可欠です。このトレードオフのバランスを取るための研究者のアプローチは、連合学習 (FL) に基づいています。
「FL プロセスは、すべてのデバイスで共有されるグローバル モデルから始まります。各デバイスはローカルでモデルをトレーニングし、更新内容を中央サーバーに送信します。中央サーバーでは、モデルを改善するために更新内容が集約されます」と研究者らは述べています。「その後、この更新されたモデルは、さらなるトレーニングのためにデバイスに再配布されます。グローバル モデルが望ましい最適な精度を達成するまで、FL サイクルは複数回繰り返されます。」
チームのモデルは各マシン上でローカルに実行され、長短期記憶 (LSTM) アーキテクチャ、ドロップアウト ユニット、および 2 つの完全に接続された密なレイヤーが含まれています。LSTM は連続データを処理し、ドロップアウト ユニットは過剰適合を減らし、密なレイヤーは最終的な予測を行うのに役立ちます。
このモデルはハイパーパラメータを使用して、ローカル LSTM モデルを調整し、中央サーバー上で同様のクライアントをクラスタ化します。トレーニングの開始前に設定されるこれらのハイパーパラメータは、機械学習モデルのトレーニング プロセスを制御します。
他のモデル
「調査対象のデータセットはイタリアのテルニの電力網から取得され、太陽光発電システムを利用して発電する30の小規模電力プロシューマーのデータで構成されています」とグループは説明しています。「正規化に続いて、データセットを80つのサブセットに分割します。モデルトレーニング用のトレーニングセットと、未知のデータに対するモデルのパフォーマンスを評価するためのテストセットです。この分割は20対2015の分割に準拠しており、2017年2018月から2019年XNUMX月までのデータはトレーニング用に指定され、XNUMX年XNUMX月からXNUMX年XNUMX月までのデータはテスト用に割り当てられています。」
次に研究者らは、同じデータセットの FL-LSTM モデルをいくつかの学習方法と比較しました。0.2 つ目は、完全にプライベートなローカライズされた環境で動作するローカライズ学習です。0.25 つ目は、通常は精度は高くなりますがプライバシーを犠牲にする集中学習です。0.3 つ目のモデルは、ノイズ乗数を 0.4、XNUMX、XNUMX、または XNUMX に設定して、個々の貢献を特定する可能性を最小限に抑えるために差分プライバシー (DP) で強化された FL です。
「モデルのパフォーマンスを評価するために、平均絶対誤差 (MAE) と二乗平均平方根誤差 (RMSE) という 2 つの主要な指標が利用されています」とグループは説明しています。「MAE を選択すると、特に外れ値に対する堅牢性 (データセットの注目すべき特徴) により、モデルの誤差範囲を包括的に把握できます。逆に、RMSE は大きな誤差に対する感度を強調します。これは、MAE よりも大幅な偏差の影響を強調するため、発電予測の精度を評価する上で非常に重要です。」
結果では、集中型モデルが MAE 0.00960、RMSE 0.01687 で最良のパフォーマンスを示したことが示されました。FL モデルの MAE は 0.01993、RMSE は 0.02872 でした。ノイズ乗数が 0.2 の FL-DP モデルでは、MAE 0.01857、RMSE 0.02669 が記録されました。ローカライズ型モデルの MAE は 0.02436、RMSE は 0.04679 でしたが、ノイズ乗数が 0.25 の FL-DP モデルでは、MAE 0.02651、RMSE 0.03375 が示されました。ノイズ乗数が 0.3 および 0.4 の場合の結果は提供されていません。
「非 DP FL 実装と同様のパフォーマンスを提供するノイズ レベルを模索する中で、興味深い異常現象に遭遇しました。ノイズ対パフォーマンス比が最適だったのはノイズ乗数が 0.2 のときで、予想外に FL よりも良い結果が得られました」とグループは指摘しています。「ノイズ乗数が 0.2 を超える実験では、予測精度が予想どおり低下し、乗数が 0.4 ではモデルが収束できないことが示されました。」
同グループは、「主な制約は、参加クライアント数に関するデータセットのサイズが限られていることです。この研究はベースラインとして機能します。時間の経過とともにプロシューマーを増やすと、FL と FL-DP のパフォーマンスが確実に向上します。そのことを念頭に置くと、私たちの結果は、参加クライアントが少ない小規模なデータセットの場合、両方のアプローチが利用可能な集合データを活用していても、集中学習が精度の点で FL を上回っていることを示しています。それにもかかわらず、FL はプライバシーと通信コストに関して利点があります。」と述べています。
彼らは、最近出版された「プライバシー保護型PV予測のための連合学習技術の強化」でその結果を発表しました。 エネルギーレポート。
このコンテンツは著作権で保護されており、再利用することはできません。 私たちと協力したい場合、および私たちのコンテンツの一部を再利用したい場合は、editors@pv-magazine.com までご連絡ください。
ソースから 太陽光発電マガジン
免責事項: 上記の情報は、Chovm.com とは独立して pv-magazine.com によって提供されています。Chovm.com は、販売者および製品の品質と信頼性について一切の表明および保証を行いません。Chovm.com は、コンテンツの著作権に関する違反に対する一切の責任を明示的に否認します。