@phdthesis{oai:sucra.repo.nii.ac.jp:00019818, author = {巳鼻, 孝朋}, month = {}, note = {xxi, 229p, 概要 i 目次 v 図目次 xi 表目次 xxi 第 1 章 はじめに 1 1.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 目的. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 本論文の構成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 第 2 章 序論 7 2.1 多腕バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 ソフトウェアアルゴリズム. . . . . . . . . . . . . . . . . . . . . . . 9 2.3.1 ε-greedy 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3.2 Softmax 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.3.3 Upper confidence bound (UCB) 法. . . . . . . . . . . . . . 10 2.3.4 綱引き理論. . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.3.5 綱引きボンベ理論. . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 光を用いた意思決定の実装. . . . . . . . . . . . . . . . . . . . . . . 16 2.4.1 単一光子を用いた実装. . . . . . . . . . . . . . . . . . . . . 16 2.4.2 半導体レーザカオスを用いた意思決定. . . . . . . . . . . . 26 2.4.3 リングレーザを用いた実装. . . . . . . . . . . . . . . . . . . 32 2.5 意思決定の応用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.5.1 意思決定を利用した無線チャネル選択. . . . . . . . . . . . 35 2.5.2 リザーバコンピューティングと組み合わせたモデル選択. . 36 2.6 レーザカオス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.6.1 Lorenz-Haken 方程式. . . . . . . . . . . . . . . . . . . . . . 39 2.6.2 戻り光を有する半導体レーザのレート方程式. . . . . . . . . 42 2.7 低周波不規則振動. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.7.1 低周波不規則振動の性質. . . . . . . . . . . . . . . . . . . . 49 2.7.2 低周波不規則振動と定常解. . . . . . . . . . . . . . . . . . . 51 2.8 レーザカオスによる同期現象. . . . . . . . . . . . . . . . . . . . . 59 2.8.1 遅延カオス同期とリーダ・ラガード関係. . . . . . . . . . . 59 2.8.2 ゼロ遅延同期とクラスタ同期. . . . . . . . . . . . . . . . . 63 第 3 章 レーザネットワークの数値計算モデルと定常解 71 3.1 リング状に一方向結合された半導体レーザのモデルとレート方程式 71 3.2 リング状に一方向結合された半導体レーザの定常解. . . . . . . . . 74 3.2.1 定常解の導出. . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.2.2 定常解の数値計算. . . . . . . . . . . . . . . . . . . . . . . . 77 3.3 ローパスフィルタの設計. . . . . . . . . . . . . . . . . . . . . . . . 80 3.4 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 第 4 章 レーザネットワークのダイナミクスの数値計算 85 4.1 戻り光を有する半導体レーザのダイナミクス調査. . . . . . . . . . 85 4.1.1 規格化注入電流が1.1 の場合. . . . . . . . . . . . . . . . . . 88 4.1.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 96 4.2 相互結合された半導体レーザのダイナミクス調査. . . . . . . . . . 101 4.2.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 102 4.2.2 規格化注入電流j が2.0 の場合. . . . . . . . . . . . . . . . . 108 4.3 リング状一方向結合された3 台の半導体レーザネットワークのダイナミクス調査. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.3.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 114 4.3.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 120 4.4 レーザネットワークによる2 次元分岐図の比較. . . . . . . . . . . . 125 4.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 第 5 章 相互結合された半導体レーザを用いた多腕バンディット問題における意思決定 131 5.1 相互結合された半導体レーザのレート方程式. . . . . . . . . . . . . 131 5.2 相互結合された半導体レーザにおける短時間相互相関値とリーダの定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 5.3 2 台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 141 5.4 平均正答率を用いた意思決定の評価. . . . . . . . . . . . . . . . . . 143 5.4.1 平均正答率. . . . . . . . . . . . . . . . . . . . . . . . . . . 143 5.4.2 平均当たり確率. . . . . . . . . . . . . . . . . . . . . . . . . 143 5.4.3 本方式による意思決定と評価. . . . . . . . . . . . . . . . . 144 5.5 パラメータ変化による性能評価. . . . . . . . . . . . . . . . . . . . 147 5.5.1 相互結合された半導体レーザの結合強度による性能評価. . 147 5.5.2 意思決定のサンプリング間隔による性能評価. . . . . . . . . 152 5.5.3 綱引き理論の結合強度差のステップ数V による性能評価. . 154 5.6 UCB1 方策との比較. . . . . . . . . . . . . . . . . . . . . . . . . . . 157 5.7 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 第 6 章 半導体レーザネットワークを用いた多腕バンディット問題における意思決定 161 6.1 3つの半導体レーザによるリング状に一方向結合されたレーザネットワークのレート方程式. . . . . . . . . . . . . . . . . . . . . . . . . 161 6.2 レーザネットワークにおける短時間相互相関値とリーダの定義. . . 164 6.3 3台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 175 6.3.1 遅延カオス同期を用いた意思決定方式. . . . . . . . . . . . 175 6.3.2 2台のスロットマシンの綱引き理論との式の等価性. . . . . 176 6.3.3 1サイクルの意思決定と平均正答率を用いた統計的評価. . . 178 6.3.4 パラメータによる意思決定の性能変化. . . . . . . . . . . . 180 6.4 4台のスロットマシンにおける意思決定とスロットマシンの配置依存性 183 6.5 n台のスロットマシンに対する意思決定とスケーラビリティ. . . . 188 6.6 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 第 7 章 半導体レーザネットワークを用いた競合バンディット問題における意思決定 191 7.1 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 191 7.2 レーザネットワークを用いた競合バンディット問題の意思決定への実装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 7.2.1 多腕バンディット問題の解法を用いた実装. . . . . . . . . . 193 7.2.2 綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . . . 195 7.2.3 改良綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . 196 7.3 平均正答率と非選択衝突率による意思決定の評価. . . . . . . . . . 199 7.3.1 綱引き理論における統計的評価. . . . . . . . . . . . . . . . 200 7.3.2 綱引きボンベ理論における統計的評価. . . . . . . . . . . . 200 7.3.3 改良綱引きボンベ理論における統計的評価. . . . . . . . . . 201 7.4 問題設定による性能変化. . . . . . . . . . . . . . . . . . . . . . . . 202 7.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 第 8 章 結論 207 謝辞 211 公表論文 213 参考文献 219, 指導教員 : 内田淳史教授, text, application/pdf}, school = {埼玉大学}, title = {半導体レーザネットワークの遅延カオス同期を用いた強化学習と意思決定}, year = {2022}, yomi = {ミハナ, タカトモ} }