画像の不等式が成り立つことが凸関数であることと同値であることを示したいのですが、やり方がわかりません。ヘッセ行列について調べてみたのですが、不等式にあるhihjをどうすればいいのかわかりません。教えていただけると幸いです。
|
No.79795 - 2021/12/04(Sat) 09:14:25
| ☆ Re: 凸関数 / やまめ | | | No.79796 - 2021/12/04(Sat) 09:18:13 |
| ☆ Re: 凸関数 / ast | | | x や h_k (k=1,…,n) にももっとちゃんと設定 (少なくとも∀なのか∃なのか, さらに前者なら h_k∈R のような範囲, 後者ならどういう条件からきまるのか, など) があるはずなのに書かないのは, もしそのあたりを軽視してるからなのだとすると文脈を取り損なう危険が大きいと思います. # あと「○○」という概念を定義したすぐ後くらいに「○○であること」と同値であることを示せという問題の場合, # ○○であることの「定義」の仕方が質問者の読んでいる文献の定義の仕方だけとは限らず, # たいていその問題で始めて与えられたほうの条件を定義として採用している他の文献がふつうにあるので, # 質問の際には質問者 (の読んでいる資料) が採用している定義を併せて提示するべきだと思います. ## (はっきり述べなければ, (質問者の状況からは) おかしな回答が返ってくる蓋然性が高くなる)
それで, もし h_k が任意の実数値をとる変数で, x が (任意に選んだ値で) 固定されている (つまり a_{i,j}:=∂^2f(x)/∂x_i∂x_j はただの定数と思える) 状況であるならば, 与えられた不等式は「ヘッセ行列 Hess(f(x)):=(∂^2f(x)/∂x_i∂x_j)_{1≤i,j≤n} を係数行列とし h=(h_1,…,h_n) を変数とする二次形式 ?納i,j=1,…,n] a_{i,j}*h_i*h_jが (変数 h に関して) 常に非負」という意味ですから, これは「(固定された x における) ヘッセ行列 Hess(f(x)) が半正定値」ということを言う内容になっています.
また, もし固定された点 x からベクトル h 分だけ小さく変動した点 x+h の間の f の変化を考えるならば, f(x+h) ≈ f(x) + ?納k=1,…,n] (∂f(x)/∂x_k)h_k + ?納i,j=1,…,n] (∂^2f(x)/∂x_i∂x_j)h_i*h_j = f(x) + (∂f(x)/∂x, h) + (1/2)* thHess(f(x))h は 2 次の (テーラー) 近似ということができます. 所期の不等式は, したがって, f の 2 次の挙動について規定するものであると認識できるはずです. # 最後の式ですが, 1次の項はベクトルの内積, 2 次の項は行列の積として線型代数の言葉でまとめると, # 1 変数のときのテイラー近似 f(x+h) ≈ f(x) + f'(x)h + f''(x)h^2/2 とほとんど変わらない形で書けている, # というふうに見ることができると思います.
ここまでを踏まえたうえで本問については 「任意の 2 点 a:=x, b:=x+h を結ぶ線分 (1-λ)a+λb=x+λh (0 < λ < 1) 上での f (の 2 次近似) の挙動が λ に関して凸になるかどうか」 をみれば所期の不等式と話が結びつくのでは. # もしピンとこない場合などにきちんと話を追うには, 1 変数函数の凸性判定を復習するのがよいでしょう. ## おそらく多変数に手を出すより前に, 1 変数のときに 「函数を 2 次近似して凸性を判断する」とか ## 「函数 f が凸になることを二階微分 f'' (の符号) を使って特徴付ける」 ## というようなことを扱っているはずなので, それを敷衍します.
|
No.79822 - 2021/12/06(Mon) 10:54:57 |
| ☆ Re: 凸関数 / やまめ | | | 丁寧な返信ありがとうございます。 任意のx,y∈R^nとt∈[0,1]の条件の下で f((1−t)x+ty)≤(1−t)f(x)+tf(y)が成り立つことと、任意のh∈R^nの条件の下で画像の不等式が成り立つことが同値であることを示せという問題でした。関数fはf''≧0のときに凸であるということは知っているのですが、その場合やはりhihjの正負がわからないと上手く出来ないと思います。おそらく、tの範囲からhについての条件がわかると思うのですが、どうしていいのかがわかりません。よろしければお教え下さい。
|
No.79827 - 2021/12/06(Mon) 18:59:04 |
| ☆ Re: 凸関数 / ast | | | > おそらく、tの範囲からhについての条件がわかると思う h は任意ですから条件は出ません (むしろ出たらその時点で任意にとれず何かがおかしい). 多変数函数が (考えている点の近傍で) 凸であるためには, (定義域に「垂直」な) 任意の平面で切った f のグラフの断面となる平面曲線 (を適当な変数に関する一変数の函数のグラフと見たもの) が凸でなければならないので, そのような観点で条件を見直してください.
> 関数fはf''≧0のときに凸であるということは知っているのですが、その場合やはりhihjの正負がわからないと 一変数の場合の "f″≥0" に相当するものは, この場合「ヘッセ行列 Hess(f(x)) が (考えている点の近傍で常に) 半正定値 (Hess(f(x)≥0)」なので, 個別の h_k や h_i*h_j の性質を考えるものではありません. # わざわざ No.79822 で遠回りに二次近似の話をして踏まえろと言ったのは, 多変数・一変数間のアナロジーで # 何が何に相当するかということをきちんと認識してもらうためです.
> 任意のx,y∈R^nとt∈[0,1]の条件の下で > f((1−t)x+ty)≤(1−t)f(x)+tf(y)が成り立つこと については既に述べた通り, f 上の任意の二点 x, y を止めて, 始点 x からベクトル h:=y−x 方向へ向かうときの挙動だけを考えればよいです (あとで h を任意に動かす). # 一変数のときも, グラフ上の 2 点 (x,f(x)), (y,f(y)) を結ぶ割線分と f のグラフの上下関係を確認したはずです. この線分 xy 上では実質的に一変数なので, 既知の方法でしらべられるはずです.
# 具体的な答案を想定してレスしていないので # 「任意の x,y∈R^n と t∈[0,1] の条件の下でf((1−t)x+ty)≤(1−t)f(x)+tf(y)が成り立つこと」 # ⇔「任意の h∈R^n の条件の下で画像の不等式が成り立つこと」 # の⇐の話と⇒の話を明確に区別せずに説明を述べてしまっていて # もしかしたら混乱させているかもしれませんので, 先に謝っておきます.
|
No.79830 - 2021/12/06(Mon) 19:44:50 |
|