Как нам жить без новых процессоров
Истерика по поводу закрытия доступа к новейшим процессорам разгоняется умело, но что-то буксует, нет той реакции, которую ожидали наши закавыченные «партнёры». Правда, простые юзеры не знают специфики вопроса, из-за чего порой сильно волнуются.
Отчёт будет с первой линии обороны – из кабинета сисадмина, на руках которого сотня рабочих мест. Спойлер – счастлив не тот, у кого много, а тот, кому хватает.
Принцип – мощность должна быть достаточной. И вот тут мы подходим к ключевому вопросу: А СКОЛЬКО НАДО-ТО?
Это вытекает из работы, чем вы занимаетесь – строчите в ворде, кодите на удалённом сервере или рендерите в графических редакторах. Так вот, i3-2120, вышедший в 2011 г, спокойно тянет всю офисную работу, даже с учётом свежих версий офиса, которые жрут ресурсов гораздо больше, чем раньше. Да, я всем поставил SSD диски и добил память до 16 гиг, но это периферия, а проц как был, так и остался, кое-где даже смазка не поменена, так и стоит уже десять лет.
Знаете, что не понимают простые юзеры? Что вам не нужны мощные рабочие станции. Зачем? В соцсетях сидеть? В игрушках залипать? Ну, игрушки это личная проблема отдельного гражданина, на обороноспособность страны не влияет. Тем более, что уже ширится сеть сервисов, где на слабом компе можно играть в крутые игры.
У меня всего несколько компов со свежим железом — это дизайнерам, да и то началось это пару лет назад, когда свежие версии графических программ стали виснуть на старом железе.
Резюмируя. Идея чрезвычайно простая. Развитие давно упёрлось в потолок, всё более мощные микросхемы банально не используют свои мощности. Ситуация, когда бухгалтер на крутейшем компе висит на удалённом рабочем столе в 1с, а между делом рубится в Zuma, лично меня дико веселит. Не, ну а чё, на рыбалку можно и на авианосце сплавать, в чём проблема-то? И на Феррари за картошкой на дачу сгонять тоже можно, дороги в СНТ сейчас приличные. На скорости 60-80 км/ч. На Феррари. Это смешно даже на уровне банальной эрудиции.
А та же самая ситуация с компами всех пугает?
Не надо пугаться. НАМ ХВАТИТ.
Вот это нужно вбить себе на уровне подкорки. Нам хватит. Крутые компы нужны для специфических задач, которых мало, для них процы спокойно покупаются на «чёрном» рынке. В оборонке процы ещё более слабые, им хватает. Для бизнеса процов либо хватит, либо они переиграют ситуацию. Например, подключатся к облачным сервисам, или вернутся на более ранние версии программ, или привезут процы в кармане из типа туристической поездки (промышленный шпионаж никто не отменял).
Так, у нас на фирме часть конструкторов прямо сейчас сидит на 2015 Автокаде, он им больше нравится, чем свежие версии.
Я напоминаю, что первые Аватар и Матрицу рисовали на компах, которые слабее современных мобильников — и ничего, справились. Не надо попадать в ловушку маркетинга, «новый комп каждые два года» — это бред, развод на бабки, вас банально грабят. Не нужен мне на работе комп этого года, дайте мне платформу одиннадцатого года, SSD диск и памяти 16 гиг, и всё будет летать.
Собственного производства микросхем нам хватит на сколько-то лет, а там или ишак сдохнет, или падишах помрёт. Это же ещё одна фенечка, которую мало кто понимает, — время играет на нас. Сейчас тяжелейший кризис во всём мире, никто не знает, какая будет конфигурация экономики через несколько лет. Нам бы день простоять, да ночь продержаться, не поддаться на шантаж, а там уже и сами научимся.
Спокойно. Прорвёмся.
И да, когда мне рассказывают про искусственный интеллект, я вспоминаю Остапа Бендера, который возил по России грудастого монаха и выдавал его за женщину с бородой. Аплодисменты, граждане, это чудо. И денежки в шапочку кидать не забываем.
PS. У китайцев экспортные модели смартфонов массово перешли с Квалкома на Медиатек. Скажу сразу — медиатек в начальном сегменте заметно хуже, прежде всего из-за того, что вместо техпроцесса 6 нм (по которому делают Квалкомы) у дешевых медиатеков в основном 9 нм, а то даже и 12 нм. Из-за этого при сходной производдительности медиатек прилично больше жрет и греется. Но над этим работают, и положение уже прилично исправлено.
Например, уже год как MTK предлагает Dimensity 810. Это сейчас один из самых популярных чипов в начальном сегменте с 5G. Конкурентом для него выступает Snapdragon 695. Это единственный чип от Qualcomm с 5G на устройствах за ту цену. И что же мы видим? Да, 695 быстрее — но совсем не радикально. А если сравнивать MTK с более популярным в сегменте Snapdragon 680, тогда уже МТК опережает Qualcomm.
Более мощный чип MTK – Dimensity 1200. Cмартфоны с ним выдают ту же производительность, что и Snapdragon 865+ и 870.
А помните, как обзорщики и владельцы смартфонов массово жаловались на высокую температуру чипов Snapdragon 888? Так вот, та же проблема коснулась и более свежего 8 gen 1, пусть и в меньшей мере. Почему так вышло? Ведь в своих флагманах Snapdragon 888 и 8 gen 1 Qualcomm перешла на, казалось бы, более крутой техпроцесс 5 нм? Сначала были предположения, что виноват GPU Adreno 660. Однако в Snapdragon 8 gen 1 стоит уже другой видеочип, а проблема с перегревом осталась.
Оказалось, что семинанометровые Snapdragon 865 (2019-2020) и 870 производятся на заводе TSMC, а вот Snapdragon 888 и 8 gen 1 делает уже компания Samsung. Вот Самсунги и греются как печки. Видимо, Samsung столкнулась с производственными проблемами на 5 и 4 нм техпроцессах.
Флагманский MTK Dimensity 9000 с самого начала выпускается на заводе TSMC по техпроцессу 4 нм. Кстати, там же выпускаются процессоры Apple Axx Bionic. И с ним никаких проблем по температуре нет. Dimensity 9000 умудряется быть не только быстрее конкурентов, но ещё и холоднее и стабильнее. Те проблемы с перегревом, которые были у MediaTek несколько лет назад, теперь перекинулись на Qualcomm. МедиаТек же исправилась.
Относительно доступный MTK Dimensity 810 сейчас делается по техпроцессу 6 нм — и тоже не греется. Вполне ОК процессор.
А Квалком, потерявший китайский рынок смартфонов — сейчас стремительно катится в унылое гогно. Санкции працуют, как говорят хохлы.
Есть 2 области, где современные процессоры требуются в огромных количествах: облака и суперкомпьютеры.
Суперкампфьютеры у каждого дома? О, и облака.. Это так массово..
На самом деле сейчас главная область приложения самых топовых технологических процессов процессоростроения — это процессоры (точнее, SoC — система-на-чипе) для смартфонов. Не для серверов, отнюдь.
Причина банальна — нужна не просто вычислительная мощность, а мощность при минимальном энергопотреблении. Это и заставляет лепить техпроцессы в 4 нанометра.
Для справки — процессоры Пентиум-4 начинали делать по технологии 350 нм. Правда, довольно быстро перешли на 180 нм. 42 миллиона транзисторов, микроархитектура NetBurst, вот это всё.
На этой же технологии 180 нм делали и серверные Xeon вплоть до частоты 3.6 ггц.
Технически для современных серверов в большинстве применений вполне достаточно Xeon Paxville MP, сделанных по технологии 90-нм.
И это я еще не говорю о том, что вообще-то и сама архитектура Intel для большинства серверов избыточна. Там вполне достаточно RISC-систем, навроде пресловутых ARM. А для таких простых процессоров требования техпроцесса могут быть еще более снижены.
АЭС — мой дом родной? 🙂
А так, суперчислодробилки должны быть у каждого универа, с десяток у РАН, десятка 2 у промышленников, n штук у военных, и большая куча у РосАтома. Итого выходит… чёй-то многовато…
И это всё надо будет через 7-10 лет менять.
Внезапно обнаружилось, что в облаках все эти Ксеоны и Ризены уже не модны. Отгадай, почему.
Предположу: В облаке особые вычислительные мощности не нужны, и достаточно современных ARM (а то и вообще MIPS).
Правда, есть облака для САПР — но это узкая ниша…
Коммерческая эффективность облака определяется прежде всего соотношением производительности к энергопотреблению.
Поэтому, например, Oracle предлагает облачные вычисления на базе ARM по цене всего 1 цент за ядро в час. И даже раздает бесплатные VPS навсегда.
Что именно предлагает Oracle? Виртуальные сервера на базе 80-ядерных процессоров Ampere Altra с архитектурой Neoverse N1 Cores Arm v8, все ядра работают на максимальной частоте 2,8 ГГц. Также, в отличие от виртуальных машин архитектуры x86-64, где просто предлагается два экземпляра с заранее заданными параметрами, с ARM все сделано по другому.
Каждый арендатор получает бесплатно первые 3000 часов условных ЦП и 18 000 ГБ-часов в месяц для создания экземпляров Ampere A1 Compute с использованием конфигурации VM.Standard.A1.Flex (эквивалентно 4 условным ЦП и 24 ГБ памяти). Кроме того, каждый арендатор получает бесплатно два экземпляра VM.Standard.E2.1.Micro.
Каждому пользователю в рамках программы «Всегда бесплатно» выделяется некоторый набор гарантированных ресурсов, если перевести их в понятные пользователю значения, то мы получим 4 OCPU и 24 ГБ памяти, которые мы можем распределить среди своих виртуальных машин. Минимальная конфигурация: 1 OCPU — 6ГБ, при увеличении числа ядер память выделяется пропорционально.
Теоретически мы можем создать до 4 инстансов в минимальной конфигурации, однако следует учитывать еще одно ограничение: размер загрузочного тома начинается от 50 ГБ, всего в рамках программы «Всегда бесплатно» сейчас предоставляется 200 ГБ, таким образом бесплатная учетная запись ограничена возможностью создать только 4 экземпляра виртуальных машин.
Таким образом, если вы используете VM.Standard.E2.1.Micro, то наиболее оптимальной стратегией будет создать еще два экземпляра VM.Standard.A1.Flex с конфигурацией 2 OCPU — 12 ГБ. Хотя никто не мешает вам просто использовать 4 виртуальных машины на базе ARM, отказавшись от x86-64 виртуалок.
Новый (2020 года выпуска) 80-ядерный ARM-процессор Ampere Altra в целочисленном бенчмарке SPECrate 2017 показывает более высокую производительность, чем самый быстрый 64-ядерный AMD EPYC или топовый 28-ядерный Xeon семейства Cascade Lake.
При этом кушает он 45-210 Вт, тактовая частота — 3 ГГц.
Процессор предназначен для серверных приложений, таких как аналитика данных, искусственный интеллект, базы данных, хранилища, телекоммуникационные стеки, пограничные вычисления, веб-хостинг и облачные приложения. Специально для приложений машинного обучения на аппаратном уровне реализована поддержка форматов данных FP16 (числа половинной точности) и INT8 (однобайтное представление целого числа). Есть также аппаратное ускорение хэширования AES и SHA-256.
Микросхемы производятся на заводе TSMC по техпроцессу 7 нм.
Построены они на архитектуре ARM v8.2+, в которую были добавлены некоторые улучшения от ARM v8.3 и v8.4. На каждое ядро приходится 64 Кбайт кеша инструкций и данных первого уровня и 1 Мбайт кеша второго уровня, а весь процессор имеет до 32 Мбайт общего кеша третьего уровня.