我主要研究图像生成模型,并利用它们进行各种图像处理。例如,我使用这些模型来编辑真实图像。我们可以拍摄照片或绘画,并指示模型修改其中的特定部分。例如,如果图像中有人,我们可以改变他们的发型、服装风格或图像本身的风格。
还有个性化生成,当我们想要生成特定实体而不是任意对象时使用它。
我引以为豪的事情
在过去的两年里,我发表了几篇重要的论文。它们引起了广泛关注:去年年底,我获得了 Yandex 机器学习奖,以表彰我的科学成就。2022 年的第一篇论文被著名的 NeurIPS 会议(人工智能领域的顶级国际会议之一)接收。这篇论文的标题是《生成对抗网络的通用领域自适应》。
它提出了一 我的个人 种在数据有
限的情况下训练生成模型的方法。例如,如果我们想要生成逼真的人脸,我们可以收集大量逼真的人脸图像,并在这些图像上训练高质量的生成模型。
图片:HSE大学
然而,如果我们想要生成特定艺术家 WhatsApp数据 风格的人脸,我们无法收集到大量的数据集。这种风格的画作并不多,因此我们无法用如此有限的样本量来训练高质量的生成模型。于是,一个任务出现了:如何使用一个在大量逼真人脸数据集上训练的生成模型来生成特定艺术家风格的人脸?
这项任务被称为“领域自适应”,即我们让 2025 年你应该了解的 25 个 Python 框架 模型适应图像有限的新领域。在那篇论文中,我们提出了一个能够有效执行此任务的模型,它使用的参数比现有方法少几千倍,但仍然能够达到相同的质量水平。
在我们的下一篇论文中,我们进一步开发了这种方法,并解释了如何使其更加有效。该论文被另一个专注于计算机视觉和人工智能的著名会议 ICCV 接收,并于去年发表。
我还发表了有关声音生成的论文,其中我们讨论了改善声音质量和消除噪音的任务。
我的梦想我相信每 我的个人 位科学家都梦想着
创造出能够改变其研究领域的东西。写一篇经久不衰的论文,开发一种新的方法,对科学产生持久的影响。
我们可以假设我们已经创造了人工智能。 或者我们可以说我们已经发现了它。
在人工智能领域,当今的主要挑战在于我们使用的模 印度尼西亚号码列表 型难以解释。到目前为止,我们还不完全了解它们的工作原理,为什么它们在某些情况下表现良好,又为什么在其他情况下会失败。
从这个意义上讲,我们就像20世纪初的物理学家,他们开始发现物理学中令人着迷的效应,但却无法完全解释这些现象的根本本质。深度学习也出现了类似的情况:我们观察到这些模型的特性,它们产生了令人印象深刻的结果,但我们无法完全解释其背后的原因。