Um aum ent o da capacidade preditiva de m odelos PLS, oferecida pela seleção de variáveis (Seção 2 .3) , aliada ao bom desem penho do APS em diversas aplicações [66- 74], m ot ivaram o desenvolvim ent o de um algoritm o que incorpore as vant agens do SPA à regressão PLS. Para esse propósit o, im plem ent aram - se algum as m odificações nas fases 1 e 2 do SPA, sendo que a fase 3 não foi ut ilizada.
O algorit m o propost o, denom inado iSAP- PLS, inicia calculando um m odelo PLS global em pregando um a quant idade de fat ores det erm inada pelo usuário, e a seguint e saída gráfica é apresent ada (Figura 3 .1) :
Figura 3 .1 - Saída gráfico do m odelo global PLS calculado no inicio da
execução do algorit m o iSPA- PLS.
Na Figura 3 .1, são apresent ados os valores de RMSECV para o PLS global em função do núm ero de fatores incluídos no m odelo. O obj etivo dessa etapa é guiar a escolha do núm ero de fat ores que
serão usados na avaliação dos intervalos. Para t ant o, o pont o de m ínim o da curva RMSECV versus núm ero de fat ores é localizado e com parado ao seu ant ecessor com base em um t est e F a 75 % de confiança estatística [76]. Se o RMSECV no pont o m ínim o, para k fatores, for m enor que o RMSECV para k- 1 de acordo com o t est e est at íst ico aplicado k fat ores, é sugerido com o sendo a dim ensionalidade inerent e ou post o da m at riz Xcal.
No ent ant o, se o t est e indicar que o RMSECV para j fat ores não é significat ivam ent e m enor que o RMSECV para k- 1 fat ores, ent ão um novo t est e F é conduzido com parando o RMSECV para k- 1 com o RMSECV obt ido para k- 2. O procedim ent o cont inua at é ser encont rada diferença significat iva ent re os RMSECV com parados. Com base no núm ero de fat ores sugeridos conform e o procedim ent o descrit o acim a e a saída gráfica do algorit m o (Figura 3 .1) , o usuário indica quant os fat ores devem ser ut ilizados nos m odelos iSPA- PLS.
9 FASE 1
I nicialm ent e, a m at riz de calibração Xcal( m xn) é part icionada em
j m at rizes de calibração denom inadas de I cal( m xj ). Assim com o no
iPLS e suas variações, a quant idade de int ervalos é um crit ério
det erm inado pelo usuário. As m at rizes I cal possuem igual quant idade de variáveis, cont udo em sit uações em que a razão ent re o núm ero de colunas de Xcal e a quant idade de int ervalos não for exata os prim eiros intervalos receberão um a variável a m ais.
Para cada intervalo, é escolhido um a variável “ representant e” do m esm o. Est a escolha é feit a det erm inando a norm a de cada variável do intervalo.
De j = 1 ate j faça
Proxim o j
N OR é um a m at riz que cont ém as norm as de cada variável dos
j int ervalos. Na et apa seguint e, é det erm inada a variável que
apresent a a m aior norm a de cada int ervalo, que são denom inadas variáveis represent ant e do respect ivo int ervalo. A m at riz iXcal( m xj )
cont endo apenas as variável represent ant es é em pregada na et apa de proj eção do SPA com o descrit o na seção 2.1. A Figura 3 .2 ilust ra o procedim ento descrito acim a.
Figura 3 .2 - I lust ração da m ont agem da m at riz iXcal usada na et apa de
proj eção do SPA.
9 FASE 2
No final da et apa de proj eções é gerada a m at riz SEL cont endo os índices das variáveis represent ant es que form a cada cadeia de int ervalos. Na fase 2 do SPA- MLR após as proj eções, é conduzida a avaliação de cada cadeia via regressão MLR. No algorit m o propost o t em os:
Dado o valor de 1 de Im ax ( núm ero m áxim o de intervalos a
selecionar) ;
De j = 1 at é j faça ( j é a quant idade de int ervalos) De m = 1 at é Im ax faça
De 1 at e K (k núm ero de fatores sugeridos pelo usuário)
- Use as variáveis represent ant es com índices SEL( 1,k) , SEL( 2,k) , ..., SEL( m ,k) para const ruir um m odelo PLS em pregando os respect ivos int ervalos, com validação cruzada com plet a.
Próxim o K
Próxim o I
Próxim o j .
Ao contrario dos outros algoritm os que fazem seleção de int ervalos, o iSPA- PLS possibilit a selecionar entre 1 e j - 1 intervalos. Após avaliar t odas as cadeias de intervalos, via regressão PLS, o que apresentar m enor RMSECV é selecionado, e o seguint e relat ório é apresent ado na j anela de com ando do Mat lab (Figura 2 .4) .
Para t er acesso a qualquer parâm et ro do m odelo, é sim plesm ent e digit ar o seguint e com ando no Mat lab [ nom e do m odelo] .[ variável] . Por exem plo, Modelo_iSPA_PLS.RMSECV. Além do relat ório apresent ado acim a, saídas gráficas t am bém são geradas para com plem ent ar os result ados (Figura 3 .4) . Na Figura 3 .3 a é apresent ado o gráfico de valor predit o versus referencia para o conj unt o de predição ext erna, enquant o na Figura 3 .4 b é m ost rado o conj unt o de int ervalos selecionados pelo algorit m o iSPA- PLS.
Figura 3 .4 - Saída gráfica do iSPA- PLS ( a) valor predit o versus referência,
( b) I nt ervalos selecionados.
Com int uit o de apresent ar o algorit m o de form a resum ida, um fluxogram a é apresent o na Figura 3 .5, m ost rando o passo a passo das et apas execut adas.
3 .2 Algorit m os usados para com paração