Что такое графический процессор (GPU)?
При покупке нового ПК/ноутбука очень полезно разбираться во всех важных внутренних компонентах, благодаря которым компьютеры, собственно, и работают.
Зная о принципах их работы, вы сможете легко понять, имеет ли рассматриваемый компьютер подходящие характеристики, еще до совершения покупки!
Сегодня мы рассмотрим очень важный внутренний компонент любого ПК: GPU, или графический процессор. Мы расскажем, что это такое, чем он отличается от видеокарты, а также несколько других деталей, о которых важно знать. Поехали!
Что такое GPU?
GPU расшифровывается как Graphics Processing Unit, то есть графический процессор. Это тип процессора, который отвечает за рендеринг графики (создание изображений, которые вы видите на экране).
Графический процессор очень важен для любых вычислительных задач, в частности таких, как 3D-рендеринг и игры.
Поэтому, при покупке ПК или ноутбука для игр или создания различного контента, важно обратить внимание на тип графического процессора, поскольку это оказывает прямое влияние на качество картинки и на быстроту выполнения задач.
Графический процессор и видеокарта – одно и то же?
В разговорной речи графический процессор часто используется в качестве синонима к видеокарте. Но технически это не совсем правильно.
Графический процессор на самом деле является частью видеокарты. Он отвечает за рендеринг графики, а видеокарта обеспечивает необходимую мощность и доступ к высокоскоростной памяти.
Кроме того, видеокарта подключает сам графический процессор к другим частям компьютера, которые требуют к нему доступ (центральный процессор, системная память и накопитель) для выполнения нужных задач.
А что такое интегрированный графический процессор?
iGPU – это интегрированный графический процессор. Иными словами, это GPU, встроенный в центральный процессор.
- Практически все процессоры Intel (за исключением серии F) оснащены встроенной графикой, поэтому у них, соответственно, есть iGPU.
- AMD же оснащает iGPU только свою линейку гибридных процессоров (APU).
При наличии интегрированной графики основной процессор использует память совместно с графическим, благодаря чему снижается энергопотребление и общая нагрузка на ПК.
Интегрированный графический процессор отлично подходит для обычных повседневных задач (например, просмотр веб-страниц и работа с текстом). Но если вам нужен мощный компьютер для игр или редактирования видео, то нужно рассмотреть покупку устройства с дискретным графическим процессором, или же dGPU.
Что такое дискретный графический процессор?
dGPU – дискретный графический процессор. Он ставится отдельно от основного процессора и имеет свою выделенную память, которая не передается ЦП.
Обычно дискретные графические системы обеспечивают лучшую производительность и способны справляться с более интенсивными задачами. Но они также потребляют больше энергии и выделяют больше тепла.
Некоторые ноутбуки оснащаются дискретной графикой, но чаще всего такие процессоры встречаются на настольных компьютерах.
Как узнать, какой графический процессор установлен в моем компьютере?
Получить информацию о графическом процессоре на своем компьютере можно в настройках устройства.
Если у вас Windows 10, нужно перейти в «Диспетчер устройств», затем выбрать пункт «Видеоадаптеры», где вы и увидите полный список графических процессоров, установленных на компьютере.
Затем нужно погуглить название, чтобы узнать, является ли процессор встроенным или дискретным.
Вы можете получить более подробную информацию о графическом процессоре вашего ПК и других характеристиках другими способами, включая использование сторонних программ.
Итоги
Теперь вы знаете немного больше о графических процессорах. Главный плюс в том, что вы можете использовать эти знания при покупке нового ПК/ноутбука.
Еще раз пройдемся по основным тезисам:
- Графический процессор – внутренний компонент компьютера, отвечающий за рендеринг графики.
- Есть два типа графических процессоров: дискретный и интегрированный.
- Если вы любитель видеоигр или часто занимаетесь созданием различного контента, то непременно покупайте ноутбук/ПК с дискретным графическим процессором.
- Если же вы не выполняете требовательные задачи, а лишь работаете с текстом или просматриваете веб-страницы в браузере, то будет достаточно и встроенного графического процессора, который, кстати, является гораздо дешевле дискретного.
Чем отличаются графические процессоры для настольных ПК и ноутбуков?
Выбор между игровым ПК и игровым ноутбуком обычно сводится к анализу производительности, а зависит она во многом от дискретного видеоадаптера. Особенно сложно разобраться, если в обоих устройствах стоит графический адаптер с одним и тем же названием.
Например, RTX 3080 Ti встречается и в лэптопах игрового класса, и в десктопных компьютерах. Однако ошибкой будет полагать, что графическая производительность у обоих устройств одинаковая. Чаще всего ноутбук запускает игры (да и в целом работает) медленнее по сравнению с ПК на таком же дискретном видеоадаптере, хотя стоит он при этом дороже.
Почему так? Дело не том, что ограниченное пространство в корпусе ноутбука не позволяет реализовать эффективную систему охлаждения, как в ПК. Да, причина может быть и такой, но она далеко не на первом месте.
Разработчикам приходится идти на разные ухищрения, чтобы производительность игровых ноутбуков не слишком отличалась от ПК. Вот почему GPU для настольных компьютеров и GPU для ноутбуков – это принципиально разные вещи.
Как работает графический процессор для настольного компьютера?
Дискретный графический процессор – это то, что в быту обычно называют видеокартой. Это печатная плата с блоком управления, несколькими портами и шиной PCI Express для подключения к материнской плате компьютера. Для надежной фиксации предусмотрены болты, а для подключения к монитору используется кабель HDMI / DisplayPort. При правильной установке графический процессор выводит на монитор изображение.
По мере того, как графика игр становится сложнее и насыщеннее, растут и возможности графических процессоров. В них появляются мощные разъемы питания (их может быть не один, а сразу два или три в зависимости от энергопотребления видеоадаптера), огромные кулеры и сложные системы охлаждения.
Настольным графическим процессорам характерно высокое энергопотребление. Как следствие, они сильно греются, но обычно в корпусе компьютера достаточно пространства для хорошей циркуляции воздуха, за счет которой рассеиваются излишки тепла.
Как работает графический процессор для ноутбука?
Полноценная десктопная видеокарта в ноутбук не поместится из-за своей габаритности. Правда, исключения существуют, но им сопутствует множество не самых приятных компромиссов. Большинство графических процессоров для ноутбуков являются урезанной версией настольных GPU. Они обязаны соответствовать ряду требований: быть достаточно маленькими, достаточно мощными для запуска современных видеоигр и при этом достаточно энергоэффективными, чтобы ноутбук не превратился в печку с экраном и взрывоопасным аккумулятором.
GPU для ноутбуков принципиально отличаются от своих настольных аналогов, даже если по наименованию относятся к одной серии.
Основное отличие касается энергоэффективности. Для снижения энергопотребления в ход идут любые средства вплоть до того, что при определенных задачах ноутбук переключается на интегрированный видеочип.
Видеоадаптеры для ПК и ноутбуков: в чем разница?
Как уже говорилось, приоритетом для ноутбучных GPU является максимально низкое энергопотребление при высоких возможностях отрисовки. Хотя производители портативных компьютеров и SoC принимают разные меры, чтобы достичь желаемого эффекта, чаще всего снижение энергопотребления достигается самым простым и грубым способом – ослаблением самого чипа.
Почему для ПК и ноутбуков существуют разные линейки видеокарт? Да потому что нельзя просто вытащить из компьютера Nvidia RTX 3090 Ti и поставить в ноутбук, чтобы со спокойной душой играть. Опустим конструктивные различия между ПК и лэптопом, просто представим, что каким-то чудом видеокарта поместилась внутри ноутбука. Что будет дальше? Уже через пару дней лэптоп начнет в прямом смысле плавиться.
GPU для настольных ПК и ноутбуков – это далекие друг от друга продукты. К сожалению, многие пользователи даже не подозревают об этом.
Вот к примеру, RTX 3080 Ti. Настольная версия этой видеокарты – настоящий зверь, способный переварить самые сложные 4К-игры на максималках. А вот ноутбучная версия по производительности где-то на уровне десктопной RTX 3070. Она мощна, это факт, но лэптоп на ее основе не вытянет те настройки графики, с которыми справится ПК на полноценной RTX 3080 Ti. А самая обида в том, что ноутбук с урезанной RTX 3080 Ti может стоить столько же или даже дороже, чем системный блок с полноценной RTX 3080 Ti.
Разница в цене – это плата за мобильность, возможность взять ноутбук под мышку и сменить локацию. Пока нет способов эффективно охлаждать портативную игровую систему, поэтому приходится жертвовать ее производительностью.
Можно ли подключить десктопный видеоадаптер к ноутбуку?
Да, это возможно. Причем решение весьма элегантное и аккуратное (насколько это вообще возможно).
Если в ноутбуке есть порт Thunderbolt 3 с поддержкой внешней видеокарты, решением может стать Razer Core X. Это бокс для установки видеокарты десктопного типа со всеми необходимыми интерфейсами и креплениями. К ноутбуку будет проложен кабель Thunderbolt, и если подключение сделано верно, карта опознается ноутбуком и на ней можно будет играть.
Удобство такого решения очень сомнительное, ведь ноутбук полностью потеряет свойственную ему от природы портативность. Прибегнуть к нему оправданно только в двух случаях:
- девайс совсем стар и слаб;
- это очень тонкий и легкий ультрабук без дискретного видеочипа.
Помимо Razer Core X есть варианты от других брендов (некоторые даже продаются в комплекте с видеокартой), но суть у них одна.
Графические адаптеры для ноутбуков слабее десктопных, но на это есть веские причины
Очень бы хотелось видеть на ноутбуке графическую мощность, аналогичную ПК с RTX 3080 или даже 3090, но увы. Ограничения по теплоотводу не позволяют разгонять кремний до той же степени: для ноутбука это чревато фатальными повреждениями.
Но вообще можно найти ноутбуки с производительностью уровня игровых ПК, что, конечно же, радует. Не радуют только их цены.
Как выбрать графический процессор для глубокого обучения
Глубокое обучение требует больших вычислительных ресурсов, поэтому очень важно, какой графический процессор (видеокарту) вы выберете для своих исследований. Надежный GPU позволит быстро вычислять оптимальные архитектуры и настройки глубоких сетей, и проводить эксперименты за дни вместо месяцев, часы вместо дней, минуты вместо часов.
Перевод статей A Full Hardware Guide to Deep Learning и Which GPU(s) to Get for Deep Learning, автор — Tim Dettmers. Ссылка на оригинал — в подвале статьи.
О том, как найти компромисс между стоимостью и производительностью в облачных GPU читайте здесь: Сравнение Cloud GPU для машинного обучения
Выбор GPU
Три основные ошибки, которые обычно делаются при выборе видеокарты:
- высокая цена/низкая производительность;
- недостаточый объем памяти;
- плохое охлаждение.
В целом, требования к памяти следующие:
- Для исследования, в котором нужна максимальная производительность: > = 11 ГБ
- Для поиска новых архитектур: > = 8 ГБ
- Любое другое исследование: 8 ГБ
- Kaggle: 4 — 8 ГБ
- Стартапы: 8 ГБ (но проверьте конкретную область применения для размеров модели)
- Компании: 8 ГБ для прототипирования, > = 11 ГБ для обучения
Другая проблема, на которую стоит обратить внимание, особенно если вы покупаете несколько RTX-карт, это охлаждение. Если вы хотите вставить GPU в слоты PCIe, которые расположены рядом друг с другом, вы должны убедиться, что получаете GPU с вентилятором. В противном случае процессоры будут перегреваться, работать медленнее (примерно на 30%) и умирать быстрее.
Стоит ли использовать несколько видеокарт?
Использование нескольких видеокарт позволит увеличить скорость обучения, поэтому имеет смысл, если у вас есть на это деньги.
Для сверточных нейронных сетей можно ожидать ускорения в 1,9x/2,8x/3,5x для 2/3/4 графических процессоров.
Для рекуррентных сетей длина последовательности является наиболее важным параметром, а для распространенных проблем NLP можно ожидать аналогичного или несколько худшего ускорения, чем для сверточных сетей.
Полносвязные сети обычно имеют низкую производительность для параллелизма данных, и для ускорения необходимы более совершенные алгоритмы.
Еще одно преимущество использования нескольких GPU, даже если вы не распараллеливаете алгоритмы, заключается в том, что вы можете запускать несколько экспериментов отдельно на каждом графическом процессоре. Вы не получаете ускорения, но получаете больше информации о производительности, используя различные алгоритмы или параметры одновременно.
Это очень полезно, если ваша главная цель — как можно быстрее получить опыт обучения сети. Это полезно и для исследователей, которые хотят попробовать несколько версий нового алгоритма одновременно.
Что один графический процессор делает быстрее другого?
Лучший показатель производительности графического процессора — комбинация пропускной способности, FLOPS и Tensor Cores.
Чтобы углубить ваше понимание и помочь сделать осознанный выбор, расскажу о том, какие части аппаратного обеспечения ускоряют работу GPU для двух наиболее важных тензорных операций: перемножения матриц и свертки.
Простой и эффективный способ думать о матричном умножении — это то, что оно ограничено пропускной способностью. То есть пропускная способность памяти является наиболее важной особенностью GPU, если вы хотите использовать LSTM и другие рекуррентные сети, которые выполняют многократное умножение матриц.
Для сверточных нейронных сетей имеет значение скорость обучения. Таким образом, TFLOP на графическом процессоре — лучший показатель производительности ResNet и других сверточных архитектур.
Тензорные сердечники слегка меняют уравнение. Это очень простые специализированные вычислительные блоки, которые могут ускорить вычисления — но не пропускную способность памяти — и, таким образом, наибольшее преимущество можно увидеть для сверточных сетей, которые с тензорными ядрами быстрее примерно на 30-100% .
В целом, правило выбора GPU для машинного обучения следующее:
- с мотрите на показатели пропускной способности, если вы работаете с RNN;
- смотрите на показатели FLOPS, если вы работаете со сверткой;
- используйте тензорные ядра, если можете себе позволить.
Производительность/стоимость
Экономическая эффективность графического процессора, вероятно, наиболее важный критерий выбора. Я провел анализ эффективности затрат, который включал пропускную способность памяти, TFLOP и Tensor Cores. Я посмотрел цены на eBay и Amazon и взвесил их 50:50, а затем посмотрел на показатели эффективности для LSTM, CNN с и без тензорных ядер. Я взял эти показатели производительности и усреднил их, чтобы получить средние оценки производительности, с помощью которых я затем рассчитал показатели производительности/стоимости. Вот результат:
Из этих данных видно, что RTX 2070 является более экономичным, чем RTX 2080 или RTX 2080 Ti. Почему это так? Способность выполнять 16-битные вычисления с Tensor Cores намного более ценна, чем просто наличие большого количества тензорных ядер. С RTX 2070 вы получаете эти функции по самой оптимальной цене.
Этот анализ также имеет определенные отклонения, которые следует учитывать:
- Цены колеблются. В настоящее время цены карты GTX 1080 Ti, RTX 2080 и RTX 2080 Ti кажутся завышенными, но в будущем они могут стать более разумными.
- Анализ не учитывает, сколько памяти вам нужно и сколько GPU вы можете разместить на своем компьютере. Один компьютер с 4 быстрыми GPU намного экономичнее двух компьютеров с самыми оптимальными картами.
Заключение
Я вижу две основные стратегии, которые имеют смысл: выбрать графический процессор серии RTX 20, чтобы получить быстрое обновление, или выбрать дешевый графический процессор серии GTX 10 и обновить его, как только RTX Titan станет доступен.
Если вы менее серьезно относитесь к производительности или она просто не нужна вам, например, в случае с Kaggle и прототипированием, вы можете значительно выиграть от дешевых графических процессоров серии GTX 10. При этом, если вы выбираете графический процессор серии GTX 10, будьте осторожны, чтобы объем памяти графического процессора соответствовал вашим требованиям.
Общие рекомендации по выбору GPU
Лучший GPU в целом: RTX 2070.
Следует избегать : любая карта Tesla; любая карта Quadro; любая карта Founders Edition; Titan V, Titan XP.
Рентабельно, но дорого: RTX 2070.
Рентабельно и дешево: GTX Titan (Pascal) с eBay, GTX 1060 (6GB), GTX 1050 Ti (4GB).
У меня мало денег: GTX Titan (Pascal) с eBay, или GTX 1060 (6 ГБ), или GTX 1050 Ti (4 ГБ).
У меня почти нет денег: GTX 1050 Ti (4 ГБ); CPU (прототипирование) + AWS / TPU (обучение); или Colab.
Я участвую в Kaggle: RTX 2070. Если вам не хватает денег, выберите GTX 1060 (6 ГБ) или GTX Titan (Pascal) c eBay для создания прототипов и AWS для окончательного обучения. Используйте библиотеку fastai.
Я работаю с технологиями компьютерного зрения или машинного перевода: GTX 2080 Ti с конструкцией вентилятора; Обновление до RTX Titan в 2019 году.
Я — исследователь NLP: RTX 2070.
Я начал углубленное изучение глубокого обучения и я серьезно к этому отношусь: начните с RTX 2070. В зависимости от того, какую область вы выберете дальше (стартап, Kaggle, исследования, прикладное глубокое обучение), продадите свой графический процессор и купите что-нибудь более подходящее примерно через два года.
Я хочу попробовать глубокое обучение, но я не серьезно: GTX 1050 Ti (4GB) или 1050 (2GB).
При подготовке материала использовались источники:
https://setphone.ru/stati/chto-takoe-graficheskiy-protsessor-gpu/
https://setphone.ru/stati/chem-otlichayutsya-graficheskie-protsessory-dlya-nastolnyh-pk-i-noutbukov/