Simulation-based design - State of the Art

State of the Art

2.2 Simulation-based design

[x, y]⊂ X . Suponha que D+_{f (}_{·; y−x) seja finita e semicontínua superior sobre ]x, y[.Suponha}

também que f◦

+(y−x)(x; y− x) e f◦−(y−x)(x; y− x) são finitas. Se f é duas vezes

C-diferenciável sobre ]x, y[, o gradiente generalizado de Clarke ∂f(x) é não vazio e f◦_{(x; y}_{− x) = max} x∗_{∈∂f (x)}x ∗_{, y}_{− x , então existe t} 0 ∈ (0, 1) tal que f (y)∈ f(x) + ∂f(x), y − x + 1 2∂ 2_{f (x + t} 0(y− x))(y − x), y − x,

sendo que o fecho acima é desnecessário caso f ∈ C1,1 _{sobre ]x, y[.}

Os resultados apresentado neste capítulo, são muito interessantes tanto do ponto de vista da análise não suave quanto da otimização.

Ainda hoje existem pesquisadores trabalhando para obter novos conceitos de derivadas di- recionais de segunda ordem generalizadas e condições para otimalidade, como o que foi feito em [3]. Entretanto, tendo em mãos as condições de otimalidade que foram sendo construidas durante esses anos, é muito natural indagar-se qual Teorema fornecendo essas condições atinge uma classe maior de problemas de otimização, utilizando os conceitos da análise não suave. É muito complicado responder essa pergunta, até mesmo porque, uma abordagem dificilmente se sobressairá sobre as outras em todos os aspectos, uma sempre leva algum tipo de vantagem em relação a outra, por exemplo o cálculo das subdiferenciais de um problema pode ser mais fácil com determinada abordagem do que o cálculo com a outra e vice-versa. O melhor seria conseguir de alguma maneira tentar unificar esses Teoremas de modo que um sane a deficiência do outro.

Em 2009 K. Pastor publicou o trabalho [9] que traz exatamente essa ideia. O autor compara as condições suficiente de segunda ordem para otimalidade de problemas sem restrições, que aparecem em [1] e [2] e depois apresenta um resultado que unifica essas condições. Vamos tentar expor de maneira clara o que foi feito em [9] e para isso, faremos uma apresentação de alguns conceitos e resultados que nos permita demonstrar a condição suficiente dada em [1] e depois faremos o mesmo com [2]. Finalizaremos este capítulo ex- pondo o Teorema que é considerado uma unificação dessas duas condições suficientes.

5.2 Alguns resultados e conceitos dados em [1].

Deﬁnição 5.2.1. (Jacobiana Aproximada) A aplicação F :Rn_{→ R}m _{admite uma jaco-}

5.2 Alguns resultados e conceitos dados em [1]. 155 para cada v ∈ Rm (5.1) D+(vF )(x, u) = lim inf t↓0 (vF )(x + tu)− (vF )(x) t ≤M ∈∂sup∗_{F (x)}Mv, u ,

para qualquer u ∈ Rn_{. Equivalentemente à}

(5.2) D+(vF )(x, u) = lim sup

t↓0

(vF )(x + tu)_{− (vF )(x)}

t ≥M ∈∂inf∗_{F (x)}Mv, u ,

para qualquer u ∈ Rn_.

Observação: A notação vF significa m

i=1

vifi, sendo fi as funções coordenadas da função

F. Se m = 1 então, a desigualdade (5.1) (ou 5.2) é equivalente à (5.3) D+F (x, u)≤ sup x∗_∈∂∗_{F (x)}x ∗_{, u} D+_{F (x, u)} _≥ _inf x∗_∈∂∗_{F (x)}x ∗_{, u}

Note também que quando m = 1, a condição (5.3) é equivalente à D+(αF )(x, u)≤ sup

x∗_∂∗_{F (x)}αx

∗_{, u}_{, (5.4)}

para cada α ∈ R e para qualquer u ∈ Rn_{. Similarmente, a condição (5.3) é equivalente à}

D+(αF )(x, u)_≥ inf

x∗_∂∗_{F (x)}αx

∗_{, u}

, (5.5) para cada α ∈ R e para qualquer u ∈ Rn_.

Proposição 5.2.1. Suponha que F : Rn _{→ R}m _{seja Lipschitz em uma vizinhança de}

x ∈ Rn_{. Então, a jacobiana generalizada de Clarke ¯}_{∂F (x) é uma jacobiana aproximada}

de F em x.

Demonstração. Para cada v ∈ Rm _{temos que}

(5.6) ∂(vF )(x)¯ _{⊂ ¯}∂F (x)v, consequentemente, para cada u ∈ Rn

(vF )◦(x, u) = max

ξ∈ ¯∂(vF )(x)ξ, u ≤ maxM ∈ ¯∂F (x)M · v, u

5.2 Alguns resultados e conceitos dados em [1]. 156

para cada u ∈ Rn _vale

D+(vF )(x, u)≤ (vF )◦(x, u) = max

M ∈ ¯∂F (¯x)Mv, u ,

segue que ¯∂F (x) é uma jacobiana aproximada de F em x.

Proposição 5.2.2. (Teorema 3.1 em [1]) Seja a, b _{∈ R}n _{e F : R}n _{→ R}m _{uma função}

contínua. Suponha que para cada x ∈ [a, b], ∂∗_{F (x) seja uma jacobiana aproximada de F}

em x. Então,

F (b)− F (a) ∈ co (∂∗_{F ([a, b])(b}_{− a))}

Demonstração. Note que o lado direito acima é a envoltória convexa de todo os pontos do tipo M(b − a), sendo M ∈ ∂∗_{F (ξ), para algum ξ} _{∈ [a, b]. Fixe v ∈ R}m _{de modo arbitrário}

e tome a função g : [0, 1] → R da seguinte forma

g(t) =v, F (a + t(b − a)) − F (a) + t(F (a) − F (b)) .

Uma vez que g é contínua em [0, 1] que é compacto, segue que g atinge seu valor máximo ou mínimo em algum t0 ∈ (0, 1). Suponha que t0 seja o minimizador de g. Então, para

cada α ∈ R, temos que D+g(t0, α)≥ 0 pois g(t0+ kα)− g(t0)≥ 0, para qualquer k ∈ R,

logo, em particular, para qualquer k > 0 temos que g(t0+kα)−g(t0)

k ≥ 0, para qualquer

α_{∈ R. Então, para cada α ∈ R segue que} D+g(t0, α) = lim inf

k↓0

g(t0+ kα)− g(t0)

k ≥ 0.

Uma vez que

g(t0+ kα)− g(t0) =

=v, F (a + (t0+ kα)(b− a)) − F (a) + (t0+ kα)(F (a)− F (b)) +

− v, F (a + t0(b− a))F (a) − t0(F (a)− F (b)) =

=v, F (a + (t0+ kα)(b− a)) + kα(F (a) − F (b)) , então lim inf k↓0 g(t0+kα)−g(t0) k = = lim inf k↓0

v, F(a + (t0 + kα)(b− a)) + kα(F (a) − F (b))

5.2 Alguns resultados e conceitos dados em [1]. 157 = lim inf k↓0 v, F(a + (t0+ kα)(b− a))) k + αv, F (a) − F (b) = = lim inf k↓0 v, F(a + (t0+ kα)(b− a)) k + α_{v, F (a) − F (b) =} = D+(vF ) (a + t0(b− a); α(b − a)) + α v, F (a) − F (b) ,

ou seja,

D+g(t0, α) = D+(vF ) (a + t0(b− a); α(b − a)) + α v, F (a) − F (b) ≥ 0,

logo, para cada α ∈ R temos

D+(vF ) (a + t0(b− a); α(b − a)) ≥ α v, F (b) − F (a) .

Tome α = 1. Desse modo,

D+(vF ) (a + t0(b− a), (b − a)) ≥ v, F (b) − F (a) ,

agora tomando α = −1 temos que

D+(vF ) (a + t0(b− a), a − b) ≥ −1 v, F (b) − F (a)

o que implica

−D+(vF ) (a + t0(b− a), a − b) ≤ v, F (b) − F (a) ,

logo, de α = 1 e α = −1 temos

−D+(vF ) (a + t0(b− a), a − b) ≤ v, F (b) − F (a) ≤ D+(vF ) (a + t0(b− a), b − a)

De (5.1) temos que

v, F (b) − F (a) ≤ sup

M ∈∂∗_{F (a+t}₀_(b−a))Mv, b − a .

Por outro lado,

−D+(vF ) (a + t0(b− a), a − b) ≥ − sup

M ∈∂∗_{F (a+t}₀_(b−a))Mv; −(b − a) =

= inf

M ∈∂∗_{F (a+t}₀_(b−a))Mv, b − a

portanto, de (5.1) temos que inf

M ∈∂∗_{F (a+t}₀_(b−a))Mv, b − a ≤ v, F (b) − F (a) ≤ sup

5.2 Alguns resultados e conceitos dados em [1]. 158

então

v, F (b) − F (a) =M v, b˜ _{− a}_{∈ ¯}co (∂∗F (a + t0(b− a))v) (b − a)

e portanto,

v, F (b) − F (a) ∈ co (∂∗F ([a, b])_{· v) (b − a) (5.7)} Uma vez que (5.7) é válida para cada v ∈ Rn _{dado, afirmamos que}

F (b)_{− F (a) ∈ co (∂}∗F ([a, b])(b_{− a)) ,}

pois caso contrário, já que ¯co (∂∗_{F ([a, b])(b}_{− a)) é um subconjunto fechado e convexo do}

Rm_{, temos pelo Teorema da Separação que existe p}_{∈ R}m _{tal que}

p, F (b) − F (a) − ǫ > sup

u∈ ¯co(∂∗_{F ([a,b])(b−a))}p, u

isto implica que

p, F (b) − F (a) > sup {α : α ∈ ¯co ((∂∗F ([a, b])_{· p)(b − a))}}

o que contradiz (5.7). Similarmente, se t0 for um maximizador de g, então, D+g(t, α)≤ 0

para cada α ∈ Rn _{dado. Utilizando a mesma linha dos argumentos acima, chegamos a}

mesma conclusão, desse modo, completamos esta demonstração.

Deﬁnição 5.2.2. Dizemos que a multifunção G :Rn_⇒_L(Rn_,_Rm_{) é localmente limitada}

em x ∈ Rn _{se existe uma vizinhança U de x e um α > 0 tal que A < α para cada}

A ∈ G(U).

Deﬁnição 5.2.3. a multifunção G : Rn _⇒ _L(Rn_,_Rm_{) é dita ser semicontínua superior}

em x se, para cada conjunto aberto V contendo G(x) existe uma vizinhança U de x tal que G(U) ⊂ V.

Observação 5.2.1. Claramente se a multifunção G é semicontínua superior em x e se G(x) é um conjunto limitado, então, G(x) é localmente limitado em x.

Proposição 5.2.3. (Teorema 3.5 em [1]) Seja F : Rn _{→ R}m _{contínua. Então, F tem}

uma aplicação jacobiana aproximada ∂∗_{F em uma vizinhança de x com ∂}∗_{F limitado}

sobre essa vizinhança, se e somente se, F é Lipschitz em alguma vizinhança de x.

Demonstração. Suponha que ∂∗_{F (y) é uma jacobiana aproximada de F em cada y que}

esteja na vizinhança U de x na qual ∂∗_{F é limitada. Sem perda de generalidade, podemos}

supor que U é convexa. Uma vez que ∂∗_{F é limitada sobre U, existe α > 0 tal que}

5.2 Alguns resultados e conceitos dados em [1]. 159

Fixe de modo arbitrário x, y ∈ U. Como U é convexo, então, [x, y] ∈ U e da Proposição 5.2.2 temos que

F (y)_{− F (x) ∈ co (∂}∗F ([x, y])_{· (y − x)) ⊂ co (∂}∗F (U )_{· (y − x)) ,} portanto

F (y) − F (x) ≤ y − x · max {A : A ∈ ∂∗_{F (U )}_{} ,}

consequentemente F (y) − F (x) ≤ αy − x, e uma vez que x, y foram escolhidos em U de modo arbitrário, seque que F é Lipschitz em U.

Reciprocamente, se F é Lipschitz em uma vizinhança U de x então, F : U ⊂ Rn _{→ R}m

é Lipschitz. Da Proposição 5.2.1 a jacobiana generalizada de Clarke é uma jacobiana aproximada de F em x, a qual é localmente limitada em x.

Observação 5.2.2. Dizemos que f :Rn _{→ R é uma função C}1 _{quando f é continuamente}

Gâteaux diferenciável.

Deﬁnição 5.2.4. Seja f :Rn _{→ R uma função C}1_{. Dizemos que f admite uma hessiana}

aproximada ∂2

∗f (x) em x se o conjunto ∂∗f (x) é uma jacobiana aproximada de∇f em x.

Vale lembrar que a jacobiana ∇f da função f : Rn _{→ R é uma função}

∇f : Rn _{→ R}n_{. Vamos denotar a jacobina aproximada da função ∇f : R}n _{→ R}n _por

∂2

∗f (x) = ∂∗∇f(x). Se M ∈ ∂∗2f (x) dizemos que M é uma matriz hessiana aproximada de

f em x. Claramente, se f é duas vezes diferenciável então,_∇2_{f (x) é uma matriz hessiana}

simétrica aproximada de f em x.

Proposição 5.2.4. Sejam f :Rn_{→ R uma função C}1 _{sobre o R}n _{e x, y ∈ R}n_{. Suponha}

que para cada z ∈ [x, y], ∂2

∗f (z) é uma Hessiana aproximada de f em z. Então,

∇f(y) − ∇f(x) ∈ co∂_∗2f ([x, y])_{· (y − x)}. Demonstração. Uma vez que f : Rn _{→ R é uma função C}1 _{sendo ∂}2

∗f (z) uma Hessiana

aproximada de f em z para cada z ∈ [x, y] segue que ∇f : Rn _{→ R}n _{é uma função}

contínua tal que para cada z ∈ [x, y], ∂2

∗f (z) é uma jacobiana aproximada de ∇f em z.

Portanto, da Proposição 5.2.2 segue que

∇f(y) − ∇f(x) ∈ co∂∗2f ([x, y])· (y − x)

5.2 Alguns resultados e conceitos dados em [1]. 160

Proposição 5.2.5. (Proposição 5.2 em [1]) Seja f :Rn_{→ R uma função C}1 _{sobre o R}n_.

Então, f possui uma aplicação Hessiana aproximada ∂2

∗f em uma vizinhança de x com

∂2

∗f limitado nessa vizinhança, e somente se, f é C1,1 em alguma vizinhança de x.

Demonstração. Considere que f seja uma função C1_{. Vamos supor que f possui uma}

aplicação Hessiana aproximada em uma vizinhança de x com ∂2

∗f limitada sobre essa

vizinhança. Então, ∇f : Rn _{→ R}n _{é uma aplicação contínua sendo que ∂}2

∗f é uma

jacobiana aproximada de ∇f em uma vizinhança de x, com ∂2

∗f limitada sobre essa

vizinhança. Portanto, da Proposição 5.2.3 segue que ∇f é localmente Lipschitz, assim garantimos que f é C1,1 _{em x.}

Reciprocamente, considerando que f : Rn _{→ R é uma função C}1_{, vamos supor que f é C}1,1

em x, logo, f é contínua com ∇f : Rn_{→ R}n _{contínua e Lipschitz em alguma vizinhança}

de x. Então, da Proposição 5.2.3 temos que ∇f possui uma jacobiana aproximada ∂2 ∗f

em uma vizinhança de x, sendo ∂2

∗f limitada sobre essa vizinhança, consequentemente f

possui uma Hessiana aproximada ∂2

∗f em uma vizinhança de x, com ∂∗2f limitada sobre

essa vizinhança.

Proposição 5.2.6. (Teorema 6.1 em [1]) Sejam f : Rn _{→ R uma função C}1 _sobre

Rn _{∈ x, y ∈ R}n_{. Suponha que para cada z} _{∈ [x, y], ∂}2

∗f (z) é uma Hessiana aproximada de

f em z. Então, existe ξ _{∈]x, y[ tal que} f (y)∈ f (x) +∇f(x), y − x +1 2co ∂_∗2f (ξ)· (x − y), (y − x)

Demonstração. Seja h : [0, 1] → R dada por

h(t) = f (y + t(x− y)) + t ∇f(y + t(x − y)), y − x + 1 2at

2_{− f(y),}

Sendo a = −2 (f(x) − f(y) + ∇f(x), y − x) . Aqui, por conveniência de notação vamos denotar a derivada direcional de (vF ) em w na direção u por ∇f(w), vw .

Como h(0) = 0 e

h(1) = f (x) +_{∇f(x), y − x − (f(x) − f(y) + ∇f(x), y − x) − f(y) =} = f (x) +_{∇f(x), y − x − f(x) + f(y) − ∇f(x), y − x − f(y) = 0}

Além disso, já que f é C1_{, então, h é contínua sobre [0, 1]. Logo, h atinge seu valor}

extremo em algum ponto γ ∈ (0, 1). Suponha γ seja um maximizador de h. Então, para qualquer v ∈ R e λ > 0 suficientemente pequeno, h(γ +λv)−h(γ) ≤ 0, consequentemente, D+_{h(γ, v) = lim sup}

λ↓0

h(γ+λv)−h(γ)

5.2 Alguns resultados e conceitos dados em [1]. 161

Observe que

h(γ+λv) = f (y + (γ + (λv)(x_{− y))+(γ+tv) ∇f(y + (γ + (λv)(x − y), y − x+}1

2a(γ+λv)

e h(γ) = f(y + γ(x − y)) + γ ∇f(y + γ(x − y)), y − x + 1 2aγ

logo,

h(γ + λv)_{− h(γ) = f(y + (γ + λv)(x − y)) − f(y + γ(x − y))+} +(γ + λv)_{∇f(y + (γ + λv)(x − y), y − x) − γ ∇f(y + γ(x − y)), y − x +}

+a(γ + λv)

2_{− aγ}2

2 .

Uma vez que f é C1 _{e a função g(γ) = a · γ, para qualquer γ ∈]0, 1[ são deriváveis, temos}

que 0≥ D+_{h(γ, v) = lim sup} λ↓0 h(γ + λv)− h(γ) λ = lim λ↓0 f (y + (γ + λv)(x_{− y)) − f (y + γ(x − y))} λ + 1 2limλ↓0 a(γ + λv)2_{− aγ}2 λ + + lim sup λ↓0

(γ + λv)_{∇f(y + (γ + λv)(x − y)), y − x − γ ∇f(y + γ(x − y), y − x}

λ =

= lim

λ↓0

f (y + γ(x− y) + λv(x − y)) − f(y + γ(x − y))

λ + 1 2limλ↓0 a· 2 · λ · γv + a · λ2_{· v}2 λ + + lim sup λ↓0 {

γ_{∇f(y + (γ + λv)(x − y)), y − x − γ ∇f(y + γ(x − y), y − x)}

λ +

+λv∇f(y + (γ + λv)(x − y)), y − x

λ } =

=∇f(y + γ(x − y)), v(x − y) + a · γ · v + v ∇f(y + γ(x − y), y − x) + +γ lim sup

λ↓0

∇f(y + (γ + λv)(x − y)), y − x − ∇f(y + γ(x − y), y − x

λ =

= a· γ · v + γ lim sup

λ↓0

∇f(y + γ(x − y) + λv(x − y)), y − x − ∇f(y + γ(x − y)), y − x

λ .

Tome ξ = y + γ(x − y). Logo, ξ ∈]x, y[ e para v = −1 temos 0≥ −aγ + γ lim sup

λ↓0

∇f(y + γ(x − y) + λ(y − x)), y − x − ∇f(y + γ(x − y)), y − x)

λ ,

logo 0_{≥ −a +} inf

M ∈∂2 ∗f (ξ) M(y − x), y − x , ou seja, a≥ inf M ∈∂2 ∗f (ξ) M(y − x), y − x .

5.2 Alguns resultados e conceitos dados em [1]. 162

Por outro lado, se v = 1 temos que 0_{≥ aγ + γ lim sup}

λ↓0

∇f(y + γ(x − y) + λ(x − y)), y − x − ∇f(y + γ(x − y)), y − x

λ ,

ou seja,

0_{≥ a + lim sup}

λ↓0

∇f(y + γ(x − y) + λ(x − y)), y − x − ∇f(y + γ(x − y)), y − x λ

logo

−a ≥ lim sup

λ↓0

∇f(y + γ(x − y) + λ(x − y)), y − x − ∇f(y + γ(x − y)), y − x

λ ≥ ≥ inf M ∈∂2 ∗f (ξ) M(y − x), x − y , consequentemente a_{≤ −} inf M ∈∂2 ∗f (ξ) [_{− M(y − x), y − x] =} sup M ∈∂2 ∗f (ξ) M(y − x), y − x . Portanto, temos que

inf M ∈∂2 ∗f (ξ) M(y − x), y − x ≤ a ≤ sup M ∈∂2 ∗f (ξ) M(y − x), y − x , desse modo, a_{∈ co}∂_∗2f (ξ)(y_{− x), y − x}. Como a

2 = f (x)− f(y) − ∇f(x), y − x , segue que

f (y)_{− f(x) − ∇f(x), y − x ∈} 1 2co ∂_∗2f (ξ)(y_{− x), y − x}, então f (y)∈ f (x) +∇f(x), y − x + 1 2co ∂_∗2f (ξ)(y− x), y − x .

O caso em que γ é um mínimo está feito em [1], assim concluímos a demonstração.

Teorema 5.2.1. (Teorema 7.6 em [1]) Seja f : Rn _{→ R uma função C}1 _{sobre R}n _e

x _{∈ R}n_{. Suponha que para cada x em uma vizinhança de ¯}_{x, ∂}2

∗f (x) seja uma Hessiana

aproximada de f em x com ∂2

∗f limitada nessa vizinhança. Se ∇f(¯x) = 0 e para cada

0 < α < 1 e cada h_{∈ R}n_{\{0} tem-se que}

(∗) ∀M ∈ ¯co∂_∗2f (¯x + αh),Mh, h > 0, então, ¯x é um minimizador local estrito de f.

5.2 Alguns resultados e conceitos dados em [1]. 163

uma sequência {xn} ⊂ Rn com xn = ¯x para todo n ∈ N e xn→ ¯x quando n → ∞ tal que

f (xn)≤ f(¯x) para cada n ∈ N.

Para cada n ∈ N, tome xn= ¯x + hn, sendo hn = 0 para cada n ∈ N. Da Proposição 5.2.6

existe 0 < αn < 1 tal que

f (xn)∈ f (¯x) +_{∇f(¯x), x}n− ¯x + 1 2co ∂_∗2f (¯x + αn· hn)(hn), hn

mas por hipótese ∇f(¯x) = 0. Logo, f (xn)∈ f (¯x) + 1 2co¯ ∂_∗2f (¯x + αn· hn)(hn), hn . Portanto, existe Mn∈ ∂∗2f (¯x + αn· hn) tal que

f (xn) = f (¯x) +

2Mn· hn, hn , ou seja,

Mn· hn, hn ≤ 0,

contradizendo (∗). Portanto, ¯x é um minimizador local estrito de f.

Note que: Uma vez que foi dado o Conceito de Jacobiana aproximada de uma função f :Rn _{→ R em um ponto x ∈ R}n _{via derivadas direcionais de Dini, inferior de primeira}

ordem como vimos em (2.1), segue de maneira natural, sendo a derivada direcional de Dini inferior de segunda ordem de f em x na direção (u, v) ∈ Rn_{× R}n _{dada por}

D+f (x, u, v) = lim inf t↓0 f′_{(x + tu; v)}_{− f}′_{(x, v)} t , sendo f′_{(x, h) = lim} t↓0 f (x+th)−f (x)

t a derivada direcional de f em x na direção h, que ∂ 2 ∗f (x)

é uma Hessiana aproximada de f em ¯x se ∂2

∗f (x) ⊂ L (Rn,L(Rn× R)) é um conjunto

fechado e

D+f (x, u, v)≤ sup M ∈∂2

∗f (x)

Mv, v para qualquer (u, v) ∈ Rn_{× R}n_.

In document Digital Twin for Structural Monitoring and Predictive Maintenance of a Maritime Crane (sider 26-31)