Нейросеть диагностирует рак по фотографии. Главные новости за 24 мая

Сверточная нейросеть, разработанная нидерландскими и датскими врачами, диагностирует рак легких по снимкам флюорографии и компьютерной томографии. Подразделение ИИ корпорации IBM разработало инструмент для перевода с одного языка программирования на другой. Британский стартап Flawless планирует выпустить программу визуального дубляжа, которая исправляет движение губ актера, чтобы на другом языке мимика выглядела естественной.

Нейросеть диагностирует рак по фотографии. Главные новости за 24 мая

Нейросети работают «по аналогии». Но ведь и люди чаще всего работают также

Медики из Нидерландов и Дании разработали сверточную нейросеть для распознавания снимков флюорографии и компьютерной томографии. Сеть анализирует снимки пациентов, у которых есть подозрение на рак легких. Обучение проводили на нескольких тысячах снимков — и здоровых легких и органов с онкологией. Сеть работает хорошо: онкологию даже на ранней стадии она распознает как минимум не хуже, чем врачебный консилиум — с точность 95%. Может быть, самое интересное, что работу выполнили сотрудники медицинских организацией и исследовательских центров, то есть работали не специалисты по ИИ, а профессиональные медики, конечно, хорошо разбирающиеся и в программировании. И как раз то, что такие, еще несколько лет назад революционные методы постепенно становятся такой же привычной процедурой как флюорография или КТ, это-то и удивляет.   

Распознавание картинок — это хорошо определенная задача: нейросеть заранее знает, что ей искать, и ее можно подготовить на размеченных человеком данных. Но конечно, не все задачи, которые человек решает, так хорошо определены. Например, в программировании все совсем не так. Чтобы сверточная сеть научилась распознавать рак, ее надо было сначала написать. И сделать это было совсем непросто. 

Сотрудники отдела ИИ корпорации IBM всерьез решили помочь как раз программистам. Вообще-то во всем, что касается приложений программирования, программисты сначала всегда заботились о себе. Так для себя они придумывают и новые языки, и сетевые протоколы, не говоря уже о средах программирования. Но вот нейросети, которая хотя бы немного облегчила работу программиста, до сих пор не было. Разработка IBM получила название CodeNet. Название дано скорее авансом — по аналогии с ImageNet: так называется база картинок для распознавания, которая стала толчком для быстрого прогресса в развитии сверточных сетей.    

CodeNet — это собрание из 14 миллионов блоков кода (500 миллионов строк) на 55 языках программирования. Код собирали из открытых баз и больше всего собрали на С++, что совсем неудивительно. Но и другие языки тоже широко представлены. Нейросети, которые обучали на этой базе, — самые разные: от простых многослойных перцептронов до продвинутых трансформеров. Но сети работают. Сегодня лучше всего они решают задачу перевода с языка на язык, например, с COBOL на Python  Когда Google Translator переводит с английского на русский и делает ошибку — это нестрашно, человек его поймет. А вот когда CodeNet при переводе ошибается — полученная программа работать не будет. А CodeNet выдает точный код в 90% случаев. Но это все равно очень здорово. Это значит, что программу на новом языке уже не надо писать с нуля, ее достаточно поправить. А это много проще. Кроме того, теперь программисты ждут, когда CodeNet сделает следующий шаг (а он анонсирован) — начнет создавать блоки кода по текстовому описанию на естественном языке. Это очень серьезно. Даже пускай в нем будут ошибки, это сэкономит время на рутинных фрагментах кода. В общем, похоже, что нейросети начинают думать и об удобстве своих создателей — программистов.

Нейросети уже умеют не только переводить тексты, но и преобразовывать картинки (как Intel Labs удалось сделать фотореалистические пейзажи в GTA V, мы недавно писали). В 2019 году в Институте информатики Макса Планка разработали генеративно-состязательную нейросеть, которая может изменить целую огромную область в индустрии развлечений — кино. Статья  немецких ученых была посвящена дублированию кинофильмов и сериалов. Да, довольно неприятно, когда Том Хэнкс шевелит губами «не в такт» словам, которые его герой говорит на русском. Немецкий математик и главный автор работы Кристиан Теобальт с коллегами разработал инструмент для точного дубляжа. Делается это так. Форест Гамп говорит по-английски. Актер дубляжа говорит, например, по-японски. Лицо Гампа «разбирается» на определенные наборы данных. Лицо актера дубляжа тоже разбирается. И нейросеть начинает сводить мимику таким образом, чтобы и движение губ и длительность реплик у Гампа точно соответствовали мимике актера дубляжа. Как результат: Гамп говорит на чистом японском и его уникальная мимика сохраняется в кадре. Статью прочитал Скотт Манн — британский режиссер, которого как раз проблема дубляжа очень волнует, и основал стартап Flawless. И этот стартап готовится поставить такое дублирование на поток уже через год. Манн говорит, что если все пойдет хорошо, будет все равно на каком языке снимали фильм, и номинация премии Оскар «Лучший фильм на иностранном языке» потеряет смысл. Впрочем, Гильдия американских киноактеров уже выразила свою озабоченность:  допустимо ли, что с лицами актеров будет что-то делать нейросеть. Гильдия — организация могущественная и может заблокировать работу по дубляжу конкретных фильмов. Но если у Flawless получится сделать дублирование точным и дешевым (немногим дороже озвучки), остановить такой дубляж будет трудно. 

Ссылка на основную публикацию