NVIDIA Tesla V100: самый технически продвинутый GPU для искусственного интеллекта
Уже почти два года NVIDIA выпускает графические процессоры на основе архитектуры Pascal. Но если в области потребительских видеоускорителей калифорнийская компания не спешит переходить к следующему поколению устройств, то в корпоративном сегменте прогресс более очевиден. Первой моделью на основе архитектуры NVIDIA Volta стала NVIDIA Tesla V100. Она найдет применение в сфере высокопроизводительных вычислений и искусственного интеллекта.
Искусственный интеллект
Все индустрии стремятся к внедрению искусственного интеллекта. В глубине постоянно растущих объемов данных лежат знания, которые могут кардинально изменить каждую отрасль. Самые невероятные возможности, начиная от индивидуального подхода к лечению раковых заболеваний и прогнозирования циклонов и заканчивая виртуальными ассистентами, способными свободно вести беседу, могут стать реальностью, когда ученые получат инструменты, необходимые для реализации своих идей.
Производитель называет NVIDIA Tesla V100 самым передовым в мире GPU для дата-центров, предназначенным для ускорения искусственного интеллекта, HPC и графики. Основанный на самой современной архитектуре GPU NVIDIA Volta, Tesla V100 предлагает в одном GPU производительность, равную 100 центральным процессорам, предоставляя ученым, исследователям и инженерам возможность находить решения для ранее нерешаемых проблем.
Революционное ядро Volta GV100
В NVIDIA Tesla V100 применяется ядро Volta GV100. Разработка последнего обошлась NVIDIA в $3 млрд, и в результате свет увидел чип площадью 815 мм², содержащий 21,1 млрд транзисторов, более 5 000 потоковых процессоров и новые блоки Tensor, повышающие производительность GPU в так называемых матричных вычислениях.
Специализированные ядра для тензорных операций являются одним из главных нововведений архитектуры Volta. Они занимаются матричными вычислениями (произведение матриц А и B складывается с матрицей C), которые используются главным образом в обработке данных сетями машинного обучения. В дополнение к этому инженеры существенно модифицировали организацию стандартных ядер CUDA с целью разместить на площади GPU как можно больше вычислительных ресурсов.
Производством передовых ядер GV100 занимается тайваньский полупроводниковый гигант TSMC. Специально для нового поколения GPU был разработан техпроцесс 12-нм FFN (последняя буква в аббревиатуре FFN обозначает NVIDIA).
Ядро Volta GV100 неотделимо от буферной памяти — четырех микросхем HBM2, взаимодействующих с GPU по 4096-битной шине. Объем каждого чипа составляет 4 ГБ, пропускная способность подсистемы памяти оценивается в 900 Гбайт/с. Ядро NVIDIA Tesla V100 работает на частоте до 1 455 МГц. Заявленное энергопотребление составляет 300 Вт.
Тренировка алгоритмов искусственного интеллекта
Ученые берутся за все более сложные задачи, начиная от распознавания речи и обучения виртуальных ассистентов и заканчивая обнаружением дорожной разметки, и обучением беспилотных автомобилей вождению. Решение подобного рода задач требует обучения экспоненциально более сложных моделей нейронных сетей в сжатые сроки.
Благодаря 43 000 ядер Tensor модель NVIDIA Tesla V100 является первым ускорителем, преодолевшим барьер производительности в 100 тера-операций в секунду (TOPS) в задачах глубокого обучения. Модели, обучение которых занимало недели на системах предыдущего поколения, теперь можно натренировать всего за несколько дней. Благодаря такому серьезному сокращению времени, затрачиваемого на тренировку алгоритмов, искусственный интеллект поможет решить совершенно новые проблемы.
Высокопроизводительные вычисления
HPC (High Performance Computing, высокопроизводительные вычисления) являются фундаментальной основой современной науки. Начиная от прогнозирования погоды и создания новых лекарств и заканчивая поиском источников энергии, ученые постоянно используют большие вычислительные системы для моделирования нашего мира и прогнозирования событий в нем. Искусственный интеллект расширяет возможности HPC, позволяя ученым анализировать большие объемы данных и добывая полезную информацию там, где одни симуляции не могут предоставить полную картину происходящего.
Ускоритель NVIDIA Tesla V100 создан для того, чтобы обеспечить слияние HPC и искусственного интеллекта. Новинка отлично проявит себя как в вычислениях для проведения симуляций, так и обработке данных для извлечения из них полезной информации. Благодаря объединению в одной архитектуре ядер CUDA и Tensor, сервер, оснащенный графическими ускорителями Tesla V100, может заменить сотни традиционных CPU-серверов, выполняя традиционные задачи HPC и искусственного интеллекта. Теперь каждый ученый может позволить себе суперкомпьютер, который поможет в решении самых сложных проблем.