机器学习|【机器学习合集】深度生成模型之图像翻译GAN

2024/01/02 机器学习 共 433 字,约 2 分钟

深度生成模型之图像翻译GAN

图像翻译的应用

1. 风格迁移

  • 各类风格化应用

image-20240102161347444

2. 数据增强

  • 仿真数据,增强数据的多样性

image-20240102161501586

3. 经典图像任务

  • 图像上色,图像分割,边缘检测,图像增强,超分辨,图像修复等

image-20240102161623269

4. 内容创作

  • 交互式图像生成,图像编辑

image-20240102161751531

5. 人脸图像编辑

  • 人脸表情,年龄,妆容,身份编辑,动漫风格化等

image-20240102162011315

6. 人体图像编辑

  • 虚拟试衣,动作迁移等

image-20240102162131886

图像翻译模型

1. 有监督图像翻译模型

  • Pix2pix,输入为图片,输出为图片,条件也是图片,需要成对的图片/标签数据进行训练

image-20240102162432821

  • Pix2pixHD,使用多尺度生成高精度结果(2048×1024)

image-20240102163244995

2. 无监督图像翻译模型

  • Couple-GAN,获取两个域的联合分布

image-20240102163539804

  • UNIT,使用两个编码器将不同域的样本X1和X2映射到共享潜在空间z,然后分别输入生成器和判别器

image-20240102163722172

  • CycleGAN,循环GAN

image-20240102163818508

  • CycleGAN工程技巧

image-20240102163930586

  • 与CycleGAN近似等价的其他结构,DualGAN,DiscoGAN,XGAN

image-20240102164034388

3. 多域图像翻译模型

  • StarGAN,多域之间的转换

image-20240102164224528

注:部分内容来自阿里云天池

文档信息

Search

    Table of Contents