AMD выпустила спецпроцессор для ChatGPT
Процессор MI300X обозначен как GPU (graphic processing unit), однако целевая сфера применения — высокопроизводительные системы, предназначенные для ИИ-вычислений.
На данный момент доминирующее положение в этой области занимает Nvidia. Ее рыночная доля составляет 80%, а по некоторым данным и более. Процессоры Nvidia используются в системах, на основе которых функционируют ИИ-модели ChatGPT, Bing AI и Stable Diffusion. Преимущество GPU заключается в возможности параллельного осуществления множества сравнительно простых вычислительных операций, что играет критически важную роль при обучении и использовании нейросетей.
В AMD предпочитают называть свои процессоры «ускорителями», хотя их назначение — составить конкуренцию графическим чипам Nvidia в таких сферах как ИИ и производство серверов. Исполнительный директор AMD Лиза Су (Lisa Su) заявила, что ИИ — «это крупнейшая и стратегически наиболее важная возможность роста» для производителя процессоров.
«Мы предполагаем, что рынок ИИ-ускорителей в дата-центрах, чей объем в этом году составляет $30 млрд, будет поступательно расти более чем на 50% каждый год и к 2027 г. превысит $150 млрд», — отметила Су.
Процессор может использовать до 192 ГБ памяти, что означает возможность работать с более крупными моделями, чем у конкурентов (H100, например, поддерживает только 120 ГБ памяти).
Объем обрабатываемой памяти для ИИ имеет критическое значение, поскольку ИИ-приложения осуществляют постоянно растущее количество вычислений. В демонстрации AMD MI300X обрабатывал модель Falcon, насчитывающую 40 млрд параметров. Модель OpenAI GPT-3 содержит 175 млрд параметров.
AMD планирует поставлять готовые системы на базе сразу восьми ускорителей MI300x (со всей необходимой периферией).
Кроме того, AMD представила свою собственную программную оболочку для ИИ-процессоров под названием ROCm, которую в СМИ сравнивают с CUDA, очень зрелым и популярным программным комплектом Nvidia, разработанным для управления графическими процессорами. Платформа CUDA позволяет, помимо прочего, производить самые разные, не связанные с графикой, вычисления на GPU.