• No results found

5. Lithostratigraphy - Results

5.1 Lithology

En observant uniquement les résultats de l’échantillonneur de la loi marginale, nous étudions maintenant l’influence du réglage des lois a priori des hyperparamètres. Dans le Tableau 3.14, on peut d’abord remarquer que quel que soit le réglage employé, le taux de CE est de 100%. Pour une loi a priori en λ favorisant la parcimonie (réglages « 2** »), le nombre d’itérations et le temps nécessaires pour atteindre le CE sont légèrement plus élevés que pour une loi non informative (réglages « 1** »). Cela confirme nos indications données en §3.4.3: une loi uniforme est préférable à un a priori fort de parcimonie. De même, une loi a priori en σx2 non dégénérée (réglages « *2* ») permet d’atteindre le CE légèrement moins rapidement que la loi a priori de Jeffreys (réglages « *1* »). Néanmoins, l’utilisation du réglage (« *2* ») permet d’éviter à la variance σx2 de devenir trop faible tout en restant efficace. Dans les deux cas, nos indications sur le réglage des lois a priori sur les hyperparamètres (de type « 12* ») se montreront plus utiles dans le cas de l’application à la détection d’exoplanètes au Chapitre4, qui est un problème bien plus difficile que ce problème test d’analyse spectrale.

Il est intéressant de comparer les valeurs des hyperparamètres estimés suivant le réglage. Les réglages de type (« 2** ») donnent un bλ plus faible que (« 1** ») ; les réglages de type (« *2* ») donnent un bσ2x plus élevé que (« *1* »). Cela est en concordance avec la loi a priori associée. Notons que l’estimation de la variance du bruit, toujours très proche de la variance de simulation, est très similaire quel que soit le réglage des lois a priori pour les autres hyperparamètres.

Réglages des hyperparamètres

« 000 » « 111 » « 211 » « 121 » « 221 »

CE : pourcentage 100 100 100 100 100

CE : itérations 328 284 328 332 490

CE : temps (en s) 6 5 7 6 9

CE : MSE (×10−8) 1.29 1.21 1.33 1.25 1.26

Temps total (en s) 183 192 218 177 174

Estimation bλ 0.050 0.067 0.031 0.063 0.031

Estimation σbx 0.500 0.449 0.466 0.615 0.625

Estimation σb 0.644 0.645 0.647 0.646 0.647

Tab. 3.14 – Comparaison des résultats des échantillonneurs de la loi marginalisée sur 50 ini- tialisations pour différents réglages des lois a priori sur les hyperparamètres. Les valeurs sont données en moyenne sur les 50 initialisations différentes. La première ligne du tableau donne le pourcentage de CE, puis les suivantes donnent, en moyenne sur les chaînes donnant un CE, le nombre d’itérations et le temps de calcul associé nécessaire pour l’atteindre, ainsi que l’er- reur quadratique moyenne (MSE) des fréquences estimées. Le temps total correspond au temps moyen mis pour effectuer les 10000 itérations.

3.5. Application du modèle BGE et de l’échantillonneur associé aux données tests

Enfin, nous avons remarqué que le phénomène d’alternance (entre des qj(t) voisins quand la fréquence théorique se trouve entre les deux intervalles) se retrouve renforcé dans le cas d’un échantillonnage non supervisé, comme on peut le voir en Figure 3.11(a) (réglage « 111 »), à comparer avec la Figure 3.8(a-droite) dans le cas supervisé. La Figure 3.11(b) montre aussi l’histogramme des « échantillons » de l’ordre du modèle10 L(t) pour les différents réglages des lois a priori sur les hyperparamètres « 000-111-211-121-221 ». Il est intéressant de remarquer que pour les réglages qui favorisent a priori la parcimonie (tous sauf « 111 »), L(t) = 5 occupe plus de la majorité des itérés ; tandis que pour le réglage le moins informatif « 111 », le pourcentage de L(t) = 5 passe sous la barre des 50% et le pourcentage L(t) = 6 augmente. Par ailleurs, cela montre l’importance d’étudier les échantillons q(t) plutôt que ceux de l’ordre du modèle L(t) = kq(t)k = kxk0, puisque les premiers sont beaucoup plus informatifs en terme de détection.

(a) Échantillons q(t) - (111) (b) Histogrammes de L(t) = kq(t)k

Indices

j

%

d’itérations

Itérations L = kqk

Fig. 3.11 – Échantillons de la séquence de Bernoulli selon la loi marginale dans le cadre non- supervisé et histogramme de L(t) = kq(t)k pour plusieurs réglages des lois a priori des hyperpa- ramètres.

3.5.5 Application sur les données de déconvolution impulsionnelle

Pour compléter notre étude, nous avons aussi testé nos échantillonneurs sur les données tests en déconvolution impulsionnelle décrites en § 1.5.2. Pour rappel, elles sont composées de 200 modèles tests de L = 4 échos aléatoirement positionnés, avec 3 niveaux de bruit différents.

Pour chacun de ces 3×200 signaux, nous avons mis en œuvre les échantillonneurs de Gibbs- hybride pour la loi jointe et la loi marginale, dans le cadre non supervisé en prenant des a priori de type (réglage de type « 121 »)11 et ce sur 10000 itérations. L’estimation de la séquence qbα est réalisée pour 2 valeurs de α différentes : 0.8 et 0.95.

Pour comparer avec les résultats obtenus au Chapitre 2, nous avons calculé pour chaque méthode et chaque niveau de détection α le pourcentage d’ELR (« Estimation exacte des loca- lisations » défini en §1.5.2) ; pour rappel, cet indice est égal à 1 uniquement si L = 4 échos sont retrouvés et si les erreurs de localisations avec les échos théoriques sont inférieures à ∆/2. Le Tableau 3.15récapitule ces résultats.

10

L’ordre du modèle est en fait calculé à chaque itération à partir de l’échantillon q(t): L(t)= kq(t)k.

11Notons que la loi a priori de Jeffreys pour la variance des amplitudes σ2

x (« *1* ») est impropre pour

l’échantillonnage ; en pratique, nous avons pu la mettre en œuvre et elle n’a pas posé de problème ; les résultats sont légèrement moins bon qu’avec une loi plus informative pour ces données.

Chapitre 3. Modèle Bernoulli-Gaussien étendu et échantillonnage stochastique

Loi Jointe Loi Marginale

α 0.80 0.95 0.80 0.95

RSB

10 61 47.5 68.5 45.5

20 57.5 56 97.5 96

30 10 11 99.5 99.5

Tab. 3.15 – Test sur les données de déconvolution : comparaison des pourcentages d’ELR sur 200 signaux entre les échantilonneurs de la loi jointe et marginale dans le cadre non supervisé. Les séquences de Bernoulliqbα sont détectées avec deux seuils α : 0.8 et 0.95. Les résultats sont observés pour 3 niveaux de bruits différents. Les pourcentages en gras mettent en lumière quelle méthode donne le meilleur pourcentage d’ELR (entre loi jointe et marginale).

Notons d’abord que le niveau de détection α = 0.95 est ici trop strict ; α = 0.8 donne de meilleurs résultats. Dans tous les cas, le pourcentage d’ELR est meilleur pour l’échantillonneur de la loi marginale que pour celui de la loi jointe pour α = 0.8, notamment pour des niveaux de bruits moins élevés (RSB=20-30dB).

Le comportement de l’échantillonneur de la loi jointe pour un bruit très faible (RSB=30dB) semble contre-intuitif, puisque les résultats ne dépassent pas 20% d’ELR (contre 99% pour la loi marginale). Une observation des échantillons q(t) nous montre que ces mauvaises estimations sont dues au blocage dans des modes locaux, comme évoqué précédemment, mais aussi à des variables de Bernoulli voisines restant toutes égales à 1 alors qu’une seule le devrait, ce qui est sûrement dû à une loi a posteriori trop piquée. Un tel comportement s’observe uniquement dans le cas de la loi jointe, car les amplitudes de ces {qj}j voisins peuvent être très faibles sans pour autant faire passer qj à 0

Dans le cas d’un niveau de bruit plus élevé (RSB=10dB), les résultats entre loi jointe et loi marginale sont à peu près équivalents. Les cas d’échec se produisent notamment quand les loca- lisations des échos sont trop proches. Nous avons aussi observé des cas où deux paramètres de Bernoulli q(t)j

1 et q

(t)

j2 non-voisins présentaient le même comportement anti-corrélé que celui ob-

servé dans le cas de fréquences voisines précédemment. De telles alternances mettent en exergue des lois bimodales, pour lesquelles l’une ou l’autre des localisations peut être présente presque sûrement. Nous reviendrons plus en détails et illustrerons ce phénomène lors de nos tests sur la détection d’exoplanète dans le chapitre suivant.

Enfin, nous pouvons comparer ces résultats avec ceux obtenus dans le Chapitre 2 avec la résolution de type `0 sur dictionnaire interpolé dans un cadre déterministe (voir Tableau 2.4

p. 78). Pour chaque niveau de bruit, les pourcentages d’ELR sont légèrement plus élevés pour l’échantillonneur marginalisé avec α = 0.8 que pour la meilleure approximation linéaire pour la résolution `0 (10dB : 68.5%/68%, 20 dB : 97.5%/94%, 30dB : 99.5%/88%). Notons qu’en particulier pour RSB=30dB, la solution `0 sur dictionnaire interpolé souffrait de l’erreur d’ap-

proximation, alors que le modèle BGE modélise exactement le signal. De plus, ces résultats sont issus d’une étude statistique avec un critère binaire strict ; pour un unique signal, le résultat des résolutions `0donne une unique interprétation, alors que celui de l’échantillonneur permet d’ob- server des probabilités de détection à travers la moyenne bq. Par exemple, pour RSB=10dB et

α = 0.7, le pourcentage d’ELR grimpe à 72.5% pour l’échantillonneur. Au-delà des performances de détection, l’échantillonnage de la loi a posteriori en les paramètres d’intérêt permettent donc une meilleure compréhension du résultat, grâce notamment au niveau de confiance de détection donné par lesqbj, et les barres d’erreur sur les localisations en prenant la variance des échantillons.

3.6. Conclusion

3.5.6 Bilan sur les tests du modèle BGE et des échantillonneurs associés