百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Chainer-GAN库发布,利用Chainer实现多种GAN算法及特征匹配去噪

wptr33 2025-05-24 17:32 2 浏览

原文来源:GitHub、Arxiv

「机器人圈」编译:嗯~阿童木呀、BaymaxZ

Chainer是一个基于Python的深度学习框架。它基于动态计算图以及面向对象的高级API,以构建并训练神经网络,提供自动微分API。它还支持CUDA / cuDNN使用CuPy进行高性能训练。

Chainer-GAN库汇集了当前最高水准的基于Chainer实现的GAN算法;

这些代码已在Cifar-10数据集中,使用inceptionscore进行过评估;

请注意,代码在基于原论文的基础上做了些许修改。

如何使用?

首先要阅读安装要求:

pip install -r requirements.txt

此实现已通过以下版本进行测试。

python 3.5.2


https://github.com/hvy/chainer-inception-score中可获得inception score模块,下文将进行详细解读。

git submodule update -i

下载inception模型。

cd common/inception

你可以使用train.py开始进行训练。

python train.py --gpu 0 --algorithm dcgan --out result_dcgan

请参阅example.sh来训练其他算法。

定量评估

Inception scores是通过对5000个样本进行10次平均评估得到的。

FID是通过对5000个训练数据集和10000个生成样本进行计算的。

生成的图像

WGAN-GP

DFM

Cramer GAN

DRGAN

DCGAN

Minibatch discrimination

BEGAN

Inception Score

Inception score模块的Chainer实现发布于《训练生成对抗网络的技术改进》(ImprovedTechniques for Training GANs)这篇论文中。代码源自OpenAI的官方开源代码(
https://github.com/openai/improved-gan)。

Inception Score是OpenAI的Tim Salimans、GANs之父IanGoodfellow等人2016年在上述论文中提出的一种方法,使用预训练的分类器网络和采样图像,评估诸如VAE和GAN之类的生成式模型。

这正是基于以下事实:良好的样本(图像看起来像来自真实数据分布的图像)预计会产生:

低熵p(y|x),即高预测置信度

高熵p(y),即高度变化的预测

其中x是图像,p(y|x)是预先训练的Inception网络给出的x的推断类标签概率,p(y)是所有图像上的边际分布。

Inception Score的定义为exp(E_x[KL(p(y|x)|| p(y))])

用法

下载预先训练好的TensorFlow模型并创建一个名为inception_score.model的Chainer副本。

python download.py --outfile inception_score.model

加载预先训练的Chainer模型,并计算包括训练图像和测试图像在内的CIFAR-10数据集的inception score。为了限制图像的数量,请使用--samples 选项。

python example.py --model inception_score.model
...

在Python中的使用示例

import numpy as npfrom chainer import serializers, datasetsfrom inception_score import Inception, inception_score

注意

从inception score的得分情况来看,该实现相较于原来的基于CIFAR-10,使用双线性插值从(32,32)到(299,299)上采样的分数要高得多。

《训练生成对抗网络的技术改进》

Inception score模块的Chainer实现发布于《训练生成对抗网络的技术改进》这篇论文中,科研人员提出了将应用于生成对抗网络(GAN)框架的各种新的架构特征和训练程序。他们专注于GAN的两个应用:半监督学习,以及人类视觉逼真意义上的图像生成。与大多数生成模型的工作不同,其主要目标不是训练一个分配高相似性以测试数据的模型,也不要求模型能够在不使用任何标签的情况下进行学习。

使用这些新技术后,科研人员在MNIST、CIFAR-10和SVHN的半监督分类中获得了可喜成果。所产生的图像具有已通过视觉图灵测试证实的高质量:该模型可以生成人类无法从实际数据中区分的MNIST样本,以及生成人为错误率为21.3%的CIFAR-10样本。我们还以前所未有的分辨率呈现除出了ImageNet样本,并显示该方法使模型能够学习到ImageNet等级的可识别特征。

在该论文中,科研人员推出了几种旨在鼓励GAN融合的技术,这些技术是从对非收敛问题的理解中获得灵感的。这使得半监督学习实现性能的提升和样本生成的改进。

更多信息可点击链接获取完整论文(
https://arxiv.org/pdf/1606.03498.pdf)

开源代码获取:
https://github.com/pfnet-research/chainer-gan-lib/blob/master/README.md

相关推荐

每天一个AI姬,AMD核显用户有福了,AI绘画打破 NVIDIA 显卡垄断

使用StableDiffusion进行AI绘画,并不一定只能使用NVIDIA英伟达显卡,甚至,也不一定只能使用独立显卡。今天我们使用AMD6800H核显,并安装了StableDif...

NETworkManager:功能强大的网络管理与问题排除工具

关于NETworkManagerNETworkManager是一款功能强大的网络管理与问题排除工具,该工具完全开源,可以帮助广大研究人员轻松管理目标网络系统并排除网络疑难问题。该工具使用远程桌面、Po...

AMD也能深度学习+免费AI绘画:StableDiffusion+ROCm部署教程!

某国政客扇扇嘴皮子,CN玩硬件和深度学习的圈子里就掀起了一场风暴,这就是著名的嘴皮子效应(误)。没了高性能计算的A100H100倒也能理解,但是美利坚这波把RTX4090禁售了就让人无语了,所以不少做...

windows 下编译 python_rtmpstream

最近在研究数字人,看了大咖的项目(https://github.com/lipku/metahuman-stream),尝试编译此项目的依赖项目python_rtmpstream(https://gi...

如何使用 Python 操作 Git 代码?GitPython 入门介绍

花下猫语:今天,我在查阅如何用Python操作Gitlab的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作Git的方法,后续有机会的话,再陆续分享之~~作者:匿蟒...

网上看了不少,终于把ZlmediaKit流媒体框架搭建起来啦

你都站在2023年代了,视频通话、视频直播、视频会议、视频监控就是风口浪尖上的猪师兄,只要你学那么一丁点,拿个高薪的工作不过分吧!我也是半瓶子晃荡的,所以路人呀,共学习,同进步!本篇开始,只讲在Lin...

MacDown:一款 macOS 的强大 Markdown 编辑器

大家好,很高兴又见面了,我是"...

ZLMediaKit安装配置和推拉流

一、ZLMediaKit库简介ZLMediaKit是一个基于...

大神赞过的:学习 WebAssembly 汇编语言程序设计

文/阿里淘系F(x)Team-旭伦随着前端页面变得越来越复杂,javascript的性能问题一再被诟病。而Javascript设计时就不是为了性能优化设计的,这使得浏览器上可以运行的本地语言一...

【Docker】部署WVP视频监控平台

回来Docker系列,今天将会跟大家分享一则关于开源WVP视频监控平台的搭建。先说结论吧,一开始按照网上说的一步一步搭建没有搭建成功,不知道是版本太旧还是我这边机器有问题,尝试了好几个不同方式的搭建都...

MongoDB+GridFS存储文件方案

GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文...

【开源】强大、创新且直观的 EDA套件

今天分享的LibrePCB是...

Ollama如何制作自己的大模型?

背景Llama3发布了,这次用了...

Ollama使用指南【超全版】

一、Ollama快速入门Ollama是一个用于在本地运行大型语言模型的工具,下面将介绍如何在不同操作系统上安装和使用Ollama。官网:https://ollama.comGithub:http...

基于区块链的价值共享互联网即时通讯应用平台源码免费分享

——————关注转发之后私信回复【源码】即可免费获取到本项目所有源码基于区块链的价值共享互联网即时通讯应用平台,是一个去中心化的任何人都可以使用的通讯网络,是一款基于区块链的价值共享互联网即时通讯AP...