Preview

Вестник НИЯУ МИФИ

Расширенный поиск

ОБРАТИМАЯ МНОГОШАГОВАЯ ДИФФУЗИОННАЯ МОДЕЛЬ ДЛЯ ПРЕОБРАЗОВАНИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ РАДИОЛОКАЦИОННЫХ И ОПТИЧЕСКИХ ДАННЫХ

https://doi.org/10.26583/vestnik.2025.3.7

EDN: QFRDOH

Аннотация

В условиях активного развития дистанционного зондирования Земли, роста доступности спутниковых данных различных типов и необходимости оперативного анализа геопространственной информации особую актуальность приобретает эффективное преобразование и объединение данных, полученных в различных диапазонах электромагнитного спектра, в частности спутниковых радиолокационных (SAR) и оптических (RGB) изображений. В данной работе предложена обратимая диффузионная модель на основе моста Шредингера для двунаправленного преобразования SAR и RGB снимков без использования парной выборки. Многошаговый стохастический процесс постепенно зашумляет данные, а нейросеть архитектуры U-Net выполняет восстановление на каждом шаге. Двунаправленная схема обеспечивает сохранение структуры сцены: прямой генератор переводит оптику в радар, а обратный — радар в оптику, обучаясь итеративно с учетом энтропийно-регуляризованного стохастического управления. Тестирование на наборах данных SEN1-2 и SN6-SAROPT показало, что по метрикам PSNR, SSIM и FID метод превосходит классические GAN-подходы (CycleGAN) и однонаправленные диффузионные модели. В полном цикле (RGB → SAR → RGB) погрешность < 5–10 % (SSIM) относительно исходного снимка, при этом достоверно воспроизводятся спекл-шум и яркие отражения, а также восстанавливается детализированная оптическая информация. Обратимая диффузия без парной выборки позволяет избежать систематических искажений и облегчает генерацию недостающих данных в ДЗЗ, мультисенсорный анализ и устранение облачности в оптическом домене.

Об авторах

А. С. Минаев
Всероссийский научно-исследовательский институт технической физики имени академика Е. И. Забабахина; Снежинский физико-технический институт — филиал ФГАОУ ВО «Национального исследовательского ядерного университета «МИФИ»
Россия

аспирант кафедры автоматизированных информационных и вычислительных систем;

инженер-программист научно-исследовательского отдела



В. В. Федоров
Всероссийский научно-исследовательский институт технической физики имени академика Е. И. Забабахина; Снежинский физико-технический институт — филиал ФГАОУ ВО «Национального исследовательского ядерного университета «МИФИ»
Россия

канд. физ.-мат. наук, доц., доц. кафедры автоматизированных информационных и вычислительных систем;

заместитель начальника научно-исследовательского отдела



Список литературы

1. Прокофьев К.В., Иванов С.В. Генерация радиолокационных снимков местности из оптических // Информатика, телекоммуникации и управление. 2022. Т. 15, № 4. С. 7–21.

2. Zhu J., Park T., Isola P. et al. Unpaired image-to-image translation using cycle-consistent adversarial networks // Proceedings of IEEE International Conference on Computer Vision (ICCV), 2017. P. 2242–2251.

3. Fu S., Xu F., Jin Y.Q. Reciprocal translation between SAR and optical remote sensing images with cascaded-residual adversarial networks // Science China Information Sciences, 2021. V. 64, 112401. Doi: 10.1007/s11432-020-3077-5

4. Ho J., Jain A., Abbeel P. Denoising diffusion probabilistic models // Advances in Neural Information Processing Systems (NeurIPS), 2020. V. 33. P. 6840–6851.

5. Song Y., Sohl-Dickstein J., Kingma D. et al. Score-Based generative modeling through stochastic differential equations // Proceedings of International Conference on Learning Representations (ICLR), 2021. 22 p. DOI:10.48550/arXiv.2011.13456

6. De Bortoli V., Thornton J., Heng J., Doucet A. Diffusion Schrodinger bridge with applications to score-based generative modeling // Advances in Neural Information Processing Systems, 2021. V. 34. P. 17695–17709.

7. Su X., Song J., Meng C. , Ermon S. Dual diffusion implicit bridges for image-to-image translation // Eleventh International Conference on Learning Representations (ICLR), 2023. 18 p. doi: 10.48550/arXiv.2203.08382

8. Li B., Xue K., Liu B. et al. BBDM: Image-to-image translation with Brownian bridge diffusion models // Proc. IEEE/CVF Conf. Computer Vision and Pattern Recognition (CVPR), 2023. P. 1952–1961.

9. Liu G.H., Vahdat A., Huang D.A. et al. I2SB: Image-to-image Schrodinger bridge // International Conference on Machine Learning (ICML), 2023. 18 p. doi:10.48550/arXiv.2302.05872

10. Kim B., Kwon G., Kim K. et al. Unpaired image-to-image translation via neural Schrodinger bridge // Proceedings of International Conference on Learning Representations (ICLR), 2024. Doi:10.48550/arXiv.2305.15086

11. Shi H., Wang Y., Xu M. et al. A brain-inspired approach for SAR-to-optical image translation based on diffusion models // Frontiers in Neuroscience, 2024. V. 18, 1352841. 14 p.

12. Seo M., Oh Y., Kim D. et al. Improved flood insights: Diffusion-based SAR to EO image translation // arXiv preprint arXiv:2307.07123. 2023. 10 p.

13. Wang X., Liao H., Yang Z. et al. Optical-ISAR image translation via denoising diffusion implicit model // Proc. IEEE Int. Conf. Image Processing and Computer Vision Applications (ICIPCA), 2023. P. 1437–1441.

14. Schmitt M., Hughes L.H., Zhu X.X. The SEN1-2 dataset for deep learning in SAR-optical data fusion // ISPRS Annals of Photogrammetry, Remote Sensing and Spatial Information Sciences, 2018. V. IV-1. P. 141–146.

15. Liu M.-Y., Breuel T., Kautz J. Unsupervised image-to-image translation networks // Proceedings of 31st Conference on Neural Information Processing Systems (NIPS), 2017, P. 700–708.


Дополнительные файлы

Рецензия

Для цитирования:


Минаев А.С., Федоров В.В. ОБРАТИМАЯ МНОГОШАГОВАЯ ДИФФУЗИОННАЯ МОДЕЛЬ ДЛЯ ПРЕОБРАЗОВАНИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ РАДИОЛОКАЦИОННЫХ И ОПТИЧЕСКИХ ДАННЫХ. Вестник НИЯУ МИФИ. 2025;14(3):249-255. https://doi.org/10.26583/vestnik.2025.3.7. EDN: QFRDOH

For citation:


Minaev A.S., Fedorov V.V. REVERSIBLE MULTI-STEP DIFFUSION MODEL FOR IMAGE TRANSLATION BETWEEN RADAR AND OPTICAL DATA. Vestnik natsional'nogo issledovatel'skogo yadernogo universiteta "MIFI". 2025;14(3):249-255. (In Russ.) https://doi.org/10.26583/vestnik.2025.3.7. EDN: QFRDOH

Просмотров: 21


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2304-487X (Print)