Обновить
256K+

Процессоры

Изучаем мозги вычислительных устройств

189,7
Рейтинг
Сначала показывать
Порог рейтинга

Пс-с, хочешь знать, что будет, если залить в сервер воду, или, может, как сэкономить в условиях мирового кризиса чипов?

Тогда запасайся чаем, устраивайся поудобнее и вперед, смотреть наш новый часовой ролик!

Никакой корпоративной скукотищи. Показываем свои новые железки и рассказываем про них, откровенно делимся инсайтами индустрии и ведем ламповые беседы о том, что в ней сейчас происходит.

Заодно увидишь наш завод, ведь снимали мы там и почти ничего не резали на монтаже.

Видео доступно на всех площадках: VK, RUTUBE, YouTube. Смотрим, подписываемся, комментируем, ставим лайки (дизлайки тоже можно). 

Теги:
+6
Комментарии0

У меня двойственное отношение к технологическим ностальгантам. С одной стороны, я с большим интересом хожу в музей истории компьютеров в Маунтин-Вью, Калифорния, а также считаю полезным введение небольшого количества исторической интроспективы в образовательные курсы, чтобы понимать истоки ключевых изобретений, например: прерывания (DYSEAC, 1954), внеочередное выполнение инструкций (CDC-6600, 1964), векторные регистры (Cray-1, 1976) итд.

С другой стороны я считаю вредным, когда старперы пытаются учить молодежь на примерах какого-то старья типа PDP-11, 6502 или Z80. Я понимаю что в 1970-х PDP-11 поразила их красотой, но все эти автодекременты с двухадресными инструкциями хорошо вписывались в микрокодовую идеологию своего времени, но не вписались даже в идеологию 1980-х, с статическим hard-wired конвейером. Ну выучил старпер молодежь ассемблеру PDP-11, а как теперь привязать это к созданию конвейерного процессора на верилоге?

Аналогично аккумуляторная архитектура 6502, которая для ностальгантов связана с молоденьким Стивом Джобсом и Apple II - это следствие не только ограниченных ресурсов 1970-х, но и того, что в те времена доступ к памяти происходил быстрее, чем арифметические операции. Только в таком контексте ее стоит упомянуть перед тем как перейти в набору регистров в современном RISC-V.

Я видел как некий прибалтийский университет пригласил к себе европейского профессора из Италии, который стал там учить студентов стоить копии Apple II - способствует ли это подготовке современных проектировщиков процессоров? Имхо пример того, что европейское не значит качественное.

Про Z80 и спектролюбцев я вообще не говорю - там попытки навести косметику на набор костылей в Intel 8080, с косвенной адресацией через конкатенацию 8-битных регистров H и L и прочий маразм. Чистая сублимация по поводу дискотек 1980-х и кучерявых девочек на них которые сейчас стали бабушками.

К чему я все это пишу. Сегодня в некоей ностальгантской группе фейсбука опубликовали пост с картинкой мануалов по 8086/8088, а также про DOS и BIOS. Я там написал что эти технологии были уже устаревшими в момент выхода этих книг в 1980-х. Далее некий немец поставил сердитый несмайлик и вступил со мной в диалог про это самое:

Теги:
+22
Комментарии15

Конференция Российского Альянса RISC-V «Технологии без ограничений»

📍Москва, МВЦ «Крокус Экспо» в рамках выставки ExpoElectronicа

⏰ вт, 14 апреля 2026, 11:30 (+0300)

💸 Бесплатно

Цель Конференции – продвижение и популяризация архитектуры, развитие экосистемы, внедрение технологии в образовательный процесс, демонстрация готовности некоторых российских RISC-V-решений к массовому внедрению в различных отраслях экономики. Конференция предоставит уникальную возможность прямого диалога между разработчиками, интеграторами и конечными заказчиками.

Что будет:

  • Пленарные сессии с участием представителей Минпромторга, Минцифры и руководства Альянса.

  • Технологические треки Технологические треки: перспективы технологии в мире и России, реализация корня доверия, готовые решения от ЭКБ до ПАК.

  • Панельные дискуссии от CloudBEAR, Байкал Электроникс, Лаборатории Касперского, Positive Technologies, МИКРОН, НИИЭТ, РегЛаб, ОВЕН, ИНКОМСИСТЕМ и других лидеров рынка по темам:

    • Развитие экосистемы RISC-V в России и мире: вызовы и решения

    • Вопросы безопасности и тестирования на уязвимости российских решений

    • Перспективы и планы лидеров ИТ-рынка России

  • Дорожная карта решений Альянса – от электронных компонентов до готовых решений АСУ ТП.

  • Презентацию программы раннего доступа к технологиям DEVBOARDS: подведение итогов 3-го этапа (на микроконтроллере Baikal-U) и запуск 4-го этапа (на микроконтроллере К1921ВГ1Т НИИЭТ).

  • Истории успеха – реальные кейсы внедрения RISC-V-решений на предприятиях.

  • Образовательный трек: проекты Академического комитета Альянса и ведущих вузов России.

  • Презентация программы «Энергия RISC-V» для энтузиастов технологии RISC-V – от студентов до профессионалов-разработчиков.

Подробная программа Конференции доступна по ссылке.

Присоединяйтесь к событию, чтобы вместе формировать будущее открытой архитектуры в России! Количество очных мест ограничено! Всем зарегистрировавшимся будет предоставлена запись мероприятия.

Промокод для получения билета на ExpoElectronicа EE26RISCV, получить билет по ссылке.

Регистрация на мероприятие.

Теги:
+4
Комментарии0

Сегодня директора стратегического маркетинга компании Synopsys спросили, что он думает насчет того, чтобы софтвер его компании писал ИИ? И знаете что он ответил? «Это дело далекого будущего. Для этого требуется математика уровня PhD, а также итеративная доработка на основе проприетарных данных от фабрик микросхем — данных, которые ИИ пока не способен полностью смоделировать. (Пока!)»

Прикол тут в том, что сам Синопсис хайпит вовсю свой ИИ-софтвер для других компаний. А сами, как вы видите, говорят: мы де перейдем на это в далеком будущем. При том, что их софтвер — это просто программы на C++. Я работал в Synopsys, так что я знаю изнутри. Так что не говорите мне, что ИИ якобы уже хорошо пишет на C++ алгоритмически-интенсивные программы.

Для тех кто не в курсе: софвер Синопсиса используют инженеры для проектирования микросхем. В комментариях мой слайд про процесс: код на языке SystemVerilog превращается в граф из логических элементов и элементов состояния (D-триггеров), потом программы размещения и трассировки раскладывают и соединяют этот граф по площадке микросхемы.

От этого трудно отмахнуться! Перед нами цитата не луддиста-отрицателя ИИ, а человека из самого истока всех чипов, которые проектирует Apple, Intel, NVidia, и даже чипов для российких дронов (компании в Зеленограде тоже используют софтвер от Synopsys). ИИ сможет писать такие программы на C++ в Да-ле-ком Бу-ду-щем. Так что в этом году всем нам AGI не грозит.

Теги:
+20
Комментарии2

Против лома нет приема! Конкурсы по ASIC Design для молодежи станут таким же привычными как математические олимпиады

Наконец-то в России наладили массовый MPW сервис производства микросхем для молодежи! Каждый студент, у которого есть способности к проектированию процессоров, аппаратных ускорителей ИИ, сетевых чипов, может бесплатно участвовать в конкурсе и спроектировать собственный чип. МИЭТ, МФТИ и другие вузы объединили усилия с промышленностью, которая произведет микросхемы для победителей бесплатно. По значимости это как создание системы математических олимпиад в СССР.

Подробности в новостях МФТИ

Мой комментарий:

Обычно студенты изучают проектирование микросхем в вузе с помощью упражнений на симуляторе языка описания аппаратуры SystemVerilog и лабораторных работах с микросхемами реконфигурируемой логики, FPGA. Но в промышленности, для проектирования и производства массовых микросхем, им понадобится изучить маршрут RTL-to-GDSII, понять статический анализ тайминга применительно к технологии ASIC итд. Именно погружению в эту черную магию поможет новый конкурс, в результате которого победители получат сконструированные ими чипы.

Технология ASIC design относится к категории "против лома нет приема". Это способ достичь самую большую производительность в цифровом мире, на пару порядков привышающее то, что можно достичь программированием готовых процессоров. Быстрее - только квантовые вычисления, и то для ограниченных задач.

Именно поэтому магистральные маршрутизаторы, ускорители ИИ, графические процессоры и другие высокопроизводительные устройства стоят именно на ASIC design, впрочем как и частный случай цифровых устройств - процессор общего назначения.

Теги:
Всего голосов 10: ↑8 и ↓2+9
Комментарии0

Аппаратный PTP на Zynq, но есть нюанс

При работе с Zynq 7000 часто встаёт вопрос: можно ли использовать встроенный PTP в GEM для IEEE 1588 timestamping? На первый взгляд — да, контроллер имеет поддержку. Но есть нюанс ...

В UG585 написано про архитектурное ограничение: таймстемпы PTP-событий хранятся в non-latching регистре — новый пакет просто перезаписывает старое значение. На практике это значит, что при высокой нагрузке процессор не успевает прочитать значение до перезаписи, и timestamp становится ненадёжным.

Актуально, если у вас строгие требования к точности PTP или высокий трафик. Стандартное решение — выносить TSU в PL или брать внешний PHY с нормальной поддержкой IEEE 1588. GEM остаётся просто интерфейсом.

Получается, что в PS у Zynq аппаратного PTP как бы и нет? Или я что-то неправильно понимаю?

Если интересуешься DSP-алгоритмами, бенчмарками и гайдами для Zynq – заходи в DSP labs.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Будет ли у России современная микроэлектроника?

После того как СМИ рассказали о триллионе рублей (1 000 000 000 000!), которые государство вкладывает в создание «Объединённой микроэлектронной корпорации», мнения разделились — одни стали ожидать, что уже завтра Россия начнёт выпускать чипы круче Apple, другие — столь же грандиозного распила. Что на самом деле?

Инвестиции планируется вложить не единомоментно, а до 2030 года. Остаётся надеяться, что всё сделано по уму: определены этапы, после выполнения которых выделяются следующие деньги. Кроме того, часть бюджета вложит Сбер — 250 млрд. Он деньги в пустоту не отдаст. И уже начал с покупки актива с самым перспективным производством в России — 42% группы компаний «Элемент», включающей производителя чипов «Микрон».

Бодрое начало, только стоит помнить, что «Микрон» обладает производством по техпроцессу 90 нм, а массовые поставки может делать по техпроцессу 180 нм. Очень далеко от современных технологий, а китайская спецоперация по переходу на 2 нм России сейчас не по силам.

Единственный выход — поэтапное развитие без шараханий из стороны в сторону. То мы в 2008 году покупаем завод с техпроцессом 130 нм у AMD, а потом не можем его запустить. То в 2022 году обещаем за 2 года нагнать 20-летнее отставание. Нельзя тратить время и ресурсы на проджекты. Стоит признать, что нужно время для создания более-менее современной литографии. Параллельно — развивать софт для проектирования микросхем: в этой сфере у нас есть хороший опыт — компания «Миландр» и создатели процессора «Байкал» проектировали реальные чипы по техпроцессу 27 нм. И очень ждут, когда он снова станет доступен для России. А там и другие производители подтянутся — нельзя же вечно надеяться на Китай.

Теги:
Всего голосов 25: ↑23 и ↓2+34
Комментарии6

10 января 2006 года Стив Джобс представил первый MacBook Pro на выставке Macworld в Сан-Франциско. Это был первый ноутбук Apple на базе процессора Intel. В честь этого события в компании провели ребрендинг. Ранее ноутбуки Apple для профессионалов назывались PowerBook и работали на чипах PowerPC. Первый MacBook Pro был представлен только с экраном 15 дюймов. Базовая конфигурация стоила $1999 и оснащалась процессором Intel Core Duo 1,67 ГГц, 512 МБ ОЗУ DDR2 с частотой 667 МГц и жёстким диском на 80 ГБ. Запись презентации первого MacBook Pro 2006 года.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

Вот на чём я хочу электронную книгу. А не на этих ваших ведроидах. Ну да, какодемонов на ней не погоняешь — скорость рефреша не та, да ещё с учётом необходимой софтовой прокладки для эмуляции VGA на еинке…

Но, тем не менее.

Натуральный DOS, весь зоопарк ретро-софта (и современного софта от любителей ретро-программирования).

Один ватт потребления, плюс пятый «Нортон» легко позволяет отправлять в спячку камень при помощи кастомного скринсейвера.

VGA 640×480×16 достаточно для небольшого экрана (типа моей, и не только моей, любимой PB360+, хотя у этой пятидюймовки был, в общем-то, 800×600, но и 640×480 вполне ОК). В крайнем случае можно заморочиться с VBE, это даже не такой уж и адок на фоне эмуляции регистров VGA.

CF в качестве «харда». Да, толстый, но в ебук-то явно влезает без проблем.

Сугубо гиковская возможность распаять любые разъёмы соответствующей эпохи по желанию, превратив её в любой желаемый контроллер-с-экранчиком. Были бы на краю платы площадки оставлены. Хоть дисководный (стримеры, ага; ну или какой-нибудь девайс с шаговыми моторами, которые типично цепляются к ардуинкам).

А ещё можно «дайте две» и сделать раскладушку с двумя страничками, соединив их в локалку :) И к зоопарку древних пошаговых игр добавятся ещё те, в которые можно поиграть по COM-порту :) Да-да, локалка из двух ретро-ПК в кармане, а ещё она по совместительству книжка с двумя страничками (для 5" самое оно).

Насчёт стоковых устройств ввода — видимо, четыре клавиши ↑↓←→, пробел, Enter, Esc, тачпад и две кнопки мыши к нему. USB там есть — дома для конфигурирования можно воткнуть клавомышь. Раз VGA всё равно эмулировать — поверх него можно сделать вызываемую отдельной кнопкой экранную клавиатуру. Тут, однако, надо заметить, что «тачпад поверх экрана» не есть тачскрин: DOS-софт «таких словей не знает» и перемещение пальца по экрану приводит к перемещению стрелки курсора совсем в другом месте (кто под UTM SE играл, тот знает). То есть оно механически тачскрин, но по факту — тачпад поверх экрана. И да, это часто удобнее, чем «настоящий» тачскрин — палец не закрывает курсор %) Но если делать именно так, разместив тачпад прямо на экране — то как раз для экранной клавиатуры он сможет выступать в роли тачскрина, эмулятор VGA ведь мы сами пишем и он-то прекрасно понимает, с чем работает и где там расположены изображения кнопок (а заодно и пространство вывода деликатно ужмётся в два раза, чтобы экранная клавиатура не закрывала экран).

Насчёт нестоковых устройств ввода — порог вхождения в кастомизацию пека нулевой. Любой гик умеет в пека эпохи дос. Будут и клавиатуры Лапера, и кастомные «под любимую игру» на всю заднюю стенку, чтобы на ощупь 8 пальцами кнопки давить, и что угодно будет.

Но в первую очередь это читалка — искаропки фридос и в автоэкзеке прописан reader.exe. Ремонтопригодная, на базе неубиваемой SoC промышленного класса, по мере износа любая флэшка меняется, жрёт мало, размеры «жилетные», короче, та 360-я, которой всем нам так не хватает, но «на стероидах».

Вот так вот, хотел по-быстрому в два абзаца, а хватило бы на небольшую статью, если проиллюстрировать каждый тезис (а без иллюстраций небось опять вышло не сильно понятнее, чем тасманские дьяволы в мультиках изъясняются).

Короче, символов осталось меньше 1К, так что заканчиваю: если кто-то из релоцировавшихся задумывается о том, чтобы взять да выкатить на рынок что-нибудь типично-стартаперное, подумайте об этом. Сайт производителей жив, наверное, что-то для кого-то ещё клепают понемногу. Даже если по нормальной цене можно только партию в 100К заказать — 100К книжек не так уж и много. Главное, чтобы ценник в итоге вышел «как хорошая книжка» (не думайте, что это прямо так уж мало).

Теги:
Всего голосов 4: ↑4 и ↓0+6
Комментарии8

Записал видео (на английском языке) своей критики выдачи ИИ тула от Абишека Вармы из университета штата Иллинойс. Тул генерит SVA (SystemVerilog Assertions) для верификации (по простонародному - QA) цифровых аппаратных блоков систем на кристалле. Для повышения понятности, в начале видео рассказал основные идеи протокола AXI (Advanced eXtensible Interface): правила хендшейка valid/ready, конвейерность транзакций, внеочередной возврат данных по запросу чтения с тэгами.

Код, который я попросил Абишека скормить тулу для ревью.

Кратко что получилось:

Правила для проверок оно пишет некорректные. Например что если записать по адресу 100 число 123, то отныне и вовеки веков если прочитать с адреса 100, то там будет 123. Не задумывается, то после первой записи и до чтения может быть вторая, которая запишет число 456.

Далее, проверка для теста проверяет что после сброса (reset) данные на шине AXI будут равны X в виде data == 'x. Но это ерунда по двум причинам: Во-первых, данные могут быть после сброса какими угодно, хоть 0, хоть 123, так как они будуг игнорироваться если с ними не ходит бит valid=1, который кстати сбрасывается в 0. Во вторых, операция сравнения == 'x (неопределенным значением) дает в качестве результата 'x. Чтобы делать именно сравнение с 'x нужно использовать другую операцию ===, то это все равно не будет работать потому что (1). Это вообще невалидный тест.

Но это все цветочки - на это его можно натаскать. Более интересный вид тупости - ИИ конструирует проверку, что если сделаны запросы с тэгами 11, 3, 4, 7, то и данные будут возвращаться в таком же порядке - с тэгами 11, 3, 4, 7. Ему не приходит в голову задать себе вопрос - если бы это было так, зачем в AXI вообще были бы нужны тэги? Они ведь нужны чтобы идентифицировать данные которые приходят не в том порядке, скажем 4, 11, 3, 7.

Итд.

Теги:
Всего голосов 8: ↑6 и ↓2+7
Комментарии0

Представлен проект онлайн-браузера микрокода 8086. Каждая 21-битная микроинструкция декодируется в читаемые поля. Наведите курсор на любое поле, и вы увидите подсказку с объяснением его назначения. Все цели перехода кликабельны — микрокод 8086 использует удивительное количество косвенных переходов, вызовов и коротких ветвлений.

Теги:
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

FFTW на Zynq: почему потребление почти не меняется?

В продолжение к прошлому посту FFTW vs Ne10 на ARM Cortex-A9 решил измерить насколько вырастет энергопотребление, если запустить бенчмарк FFTW на PS-части Zynq 7020 - получил около 0,27 Вт для всех длин FFT. Мощность считал по току с лабораторного источника питания.

По результата замеров построил графики производительности FFTW сразу в трёх метриках.

График производительности FFTW на Cortex-A9 в трех метриках
График производительности FFTW на Cortex-A9 в трех метриках
  • MFLOPS/время выполнения - показывает, насколько быстро выполняется бенчмарк при фиксированном железе и частоте;

  • MFLOPS/МГц - позволяет сравнивать, насколько хорошо алгоритм/библиотека использует каждый мегагерц CPU;

  • MFLOPS/Вт - показывает, сколько полезных операций вы получаете с одного ватта мощности.

Я ожидал увидеть зависимость потребления от длины FFT, но для расчета электропитания и теплового бюджета удобнее использовать константу 0,27 Вт. Но все же интересно, почему потребление стабильно держится на уровне 0,27 Вт независимо от размера FFT? Какие архитектурные особенности влияют на это сильнее всего? Делитесь своими мыслями в комментариях!

А в моём Telegram-канале DSP_labs вас ждут полные бенчмарки, скрипты и ещё больше примеров оптимизации DSP на embedded.

Теги:
Всего голосов 7: ↑5 и ↓2+5
Комментарии0

Короткий метр «ТЕХПРОЦЕСС» о производстве железа вышел на всех наших каналах

В этом получасовом фильме показываем то, чем гордимся и дорожим. Собственное производство полного цикла, где делаем компьютеры, серверы, ноутбуки, материнские платы и многое другое. Линии поверхностного монтажа, отдел технического контроля, сборочный цех.

А еще рассказываем о всех, ну или почти всех, наших технологических секретах.

Присоединяйтесь к экскурсии по заводу «Инферит» вместе с нашим главным технологом Кириллом Пушкиным — и увидьте весь процесс создания технологий своими глазами.

Вперед, смотреть ролик на YouTube, RUTUBE и VK Видео. И обязательно подпишитесь, чтобы не пропустить новые видео. Будем стараться делать интересно.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Ближайшие события

Волновая обработка информации

Современная вычислительная техника основана на бинарном переключении транзисторов. Это парадигма, которая доминирует уже более полувека. Но что, если мы сможем реализовать логические операции, используя не электронику, а саму форму пространства?

Обработка информации здесь реализуется через управление траекториями, интерференцией и фокусировкой волн внутри специально сконструированных геометрических поверхностях с переменой отрицательной кривизной различных видов и типов.

В этой архитектуре форма псевдоповерхности становится логическим оператором. Она определяет, как волна поведет себя в зависимости от входного возбуждения. Это полностью пассивная и многофункциональная логика.

 Принцип работы

Вычисления происходят за счет принципов Геометрической Волновой Инженерии (ГВИ), где геометрия управляет волной без использования активных компонентов:

  • Программируемая траектория. Определённые типы псевдоповерхностей перестраивают волновой фронт согласно заданным условиям.

  • Логическое условие. При определенной комбинации входных волн возбуждается заданная зона (резонанс, прохождение, выброс) — это сигнал "логическая единица".

  • Логический ноль. Если условия не выполнены, волна гасится, рассеивается или блокируется другой волной (деструктивная интерференция) — это сигнал "логический ноль".

Результат вычисления выражается в выходной амплитуде, наличии сигнала или его пространственном положении.

Механизмы управления волнами

Ключевые механизмы, позволяющие геометрии выполнять роль вычислителя:

  • Фокусная чувствительность: Геометрия действует как условный оператор: "Если фазовые условия выполнены, то фокус возникает".

  • Угловая избирательность: Разные углы ввода волны активируют разные геодезические траектории на поверхности, реализуя переключение логических путей.

  • Интерференционные окна: Наложение волн в промежуточных зонах задает условия взаимодействия.

  • Закрытые/открытые геоканалы: Геометрия может динамически запирать или открывать траектории волн, реализуя переключение без активной электроники.

 Преимущества волновой логики

Параллельная обработка – множество операций происходит одновременно в разных зонах, в отличие от имитации на многоядерных процессорах.

Нет потребления энергии на переключение. Волны, не соответствующие условиям, просто рассеиваются, а не тратят энергию на резисторы.

Естественное использование суперпозиции и интерференции как основ кодирования информации. Квантовый потенциал.

Низкая чувствительность к шуму, так как интерференционная логика устойчива за счет пространственного выделения сигнала.

Идеально подходит для работы в условиях радиации, высоких температур или агрессивной среды, где электроника неприменима.

 Реализации и перспективы

Волновая логика открывает путь к нетрадиционным формам вычислений:

  • Геометрические Чипы с микроформами псевдофокальной архитектуры.

  • Метаповерхности со встроенными фазовыми каналами для работы в ТГц и ИК-диапазонах.

  • Акустические логические оболочки, встраиваемые в сам материал (например, для робототехники).

Теги:
Всего голосов 4: ↑1 и ↓3-2
Комментарии5

Читает ли кто-нибудь в современном мире диссертации или это считаетеся какой-то фигней чтобы поставить галочку? Вспомним что вся цифровая электроника, все айфоны, интернет-роутеры и ИИ-ускорители - построены на двух диссертациях: 1) магистерской диссертации Клода Шеннона, который в 1937 году повысил уровень абстракции проектировщиков с переключателей (на основе реле и ламп) до булевской логики и/или/не и 2) диссертации 1954 года Дэвида Хаффмана в MIT, который обобщил более ранние потуги и сформулировал модель Хоффмана для последовательностной логики: комбинационное облако вычисляет следующие значения элементов состояния (сейчас это в 99+% случаев D-триггеры), которые записываются по фронту тактового сигнала.

У истории были альтернативные ветки (например электроника могла бы строится на C-элементах Мюллера), но в нашей параллельной вселенной они не прижились.

Теги:
Всего голосов 9: ↑8 и ↓1+10
Комментарии10

Товарищи студенты из проживающих в США! Кто хочет отправиться на летнюю практику и/или программу для выпускников вузов в техасском отделении Самсунга? Вы можете сходить на сайт и подать заявку напрямую (ссылка 1, ссылка 2). Альтернативно, я могу сделать для вас внутреннюю рекомендацию, так как я член команды разработки GPU в телефонах. Но так как я стараюсь рекомендовать компании только кандидатов, в качестве которых (по своим критериям) я уверен, я предлагаю всем желающим сделать одно из двух вещей:

  1. Решить задачку под названием SystemVerilog Microarchitecture Challenge for AI No.2. Adding the Flow Control. , далее получить от меня разбор вашего решения, после чего решить еще три маленькие задачки в зуме передо мною, и у вас будет рекомендация.

  2. Если вы живете в Области Сан-Францисского Залива или в Сакраменто, то сделать какой-нибудь проект на FPGA платах в рамках разработки open-source примеров для non-profit клуба Verilog Meetup (не аффилиированного с Самсунгом, это просто малочисленная тусовка, куда заходят люди из Теслы, Intel, Apple итд). Наш клуб будет на выставке самоделкиных Maker Faire в Valejo 26-28 сентября. Вы можете подойти ко мне на стенде и мы обсудим ваш проект.

После того, как вы сделаете или (1) или (2), я занесу ваше резюме во внутреннюю базу данных, вам придет письмо с предложением подать заявку, после чего, если ваше резюме выберут, вам нужно будет пройти весь официальный процесс рекрутинга.

Повышает ли моя рекомендация ваши шансы? Этого я не знаю. Как говорил Остап Бендер, полную гарантию вам может дать только страховой полис.

Пишите мне на yuri@panchul.com если вас интересует такое предложение.

Спасибо,
Юрий Панчул

Теги:
Всего голосов 11: ↑9 и ↓2+14
Комментарии2

FFTW vs Ne10 на ARM Cortex-A9: кому отдать БПФ в embedded?

Недавно в одном проекте по спектральному анализу ЛЧМ-сигналов на моей AD/DA плате я столкнулся с тем, что FFTW на Cortex-A9 в Zynq рисует задержку в сотни микросекунд — критично для реального времени. Решил проверить лёгкую библиотеку Ne10: оказалось, что на средних размерах БПФ (128–512) Ne10 даёт до +10% производительности (905 MFLOPS против 817 MFLOPS у FFTW) благодаря оптимизациям под NEON.

График производительности FFTW vs Ne10 на Cortex-A9
График производительности FFTW vs Ne10 на Cortex-A9

Однако Ne10 выигрывает не во всём: для очень малых (≤ 64) и произвольных больших размеров FFTW остаётся лидером за счёт агрессивного планирования, double-точности и возможности сохранять «wisdom»-планы. Выбор между ними зависит от сценария: если нужна быстрая интеграция и фиксированные степени двойки — Ne10, а для универсального решения с поддержкой любых N и многопоточности — FFTW.

Более подробное описание соберу в статью. А какой библиотекой пользуетесь вы и какие удивительные кейсы встречали? Делитесь в комментариях, а в моём Telegram-канале DSP_labs вас ждут полные бенчмарки, скрипты и ещё больше примеров оптимизации DSP на embedded.

Теги:
Всего голосов 6: ↑6 и ↓0+8
Комментарии2

Аркадный автомат на RISC-V: сбиваем астероиды с микроконтроллером MIK32 АМУР

Вадим Новиков решил реализовать игровую физику в условиях bare metal, используя свой предыдущий опыт на C++/SFML. В проекте использовалась плата Elbear Ace-Uno на базе микроконтроллера MIK32 АМУР, SPI OLED-дисплей SSD1306 разрешением 128×64 и джойстик HW-504 (KY-023), а также модули SPI (цифровой интерфейс передачи данных), аналого-цифровой преобразователь для калибровки и чтения положения джойстика и GPIO для вывода настройки и ввода состояния кнопки.

Код на C включал непрозрачные типы, которые позволяют реализовать подобие инкапсуляции из ООП. С ними можно объявить в заголовочном файле указатель на некую структуру, но не определять ее. А в единственной трансляции определить структуру и статические функции для взаимодействия с внутренними полями, которые недоступны извне. И поместить туда, соответственно, реализацию открытого интерфейса. Вместо использования регистров напрямую Вадим подключил библиотеку hardware abstraction layer (HAL), чтобы впоследствии было проще портировать проект на STM32 и другие микроконтроллеры.

Результатом работы стала Asteroids — реинкарнация классической игры эпохи аркадных автоматов. Корабль игрока непрерывно выпускает снаряды. После столкновений снаряда с астероидом исчезают оба объекта, при столкновении с кораблем — только астероид. Астероиды, вышедшие за нижнюю границу, возвращаются сверху экрана. Корабль же выйти за границы экрана не может.

Это лишь один из интереснейших проектов, реализованных студентами по итогам последнего потока курса YADRO по программированию микроконтроллеров на RISC-V. Интересно узнать о других проектах? Мы уже рассказали о них в статье.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Уже в четвертый раз встречаю следующий психотип. Человек окончил университет в Канаде, где в программе были в том числе лабы по FPGA. Прилетел в Калифорнию чтобы говорить и тусоваться с людьми. С вопросом: "какие есть проблемы в дизайне электроники чтобы решить их с помощью AI?"

Для меня из его реакций на некоторые мои утверждения ясно как божий день, что у него нет достаточного трейнинга в проектировании чтобы видеть эти проблемы самому. Поэтому я ему предложил всю ту же задачку на SystemVerilog (1, 2), которую я в этом году даю всем и в которой как в микрокосме представлены проблемы дизайна электроники, по крайней мере в микроархитектурной части и в контексте проекта в большой компании с использованием кода и тестового стенда других людей. Типа "решишь - поймешь в чем проблема".

Вместо того, чтобы по моим рекомендациям решить задачку и понять о чем я говорю - человек продолжает тусоваться и задавать людям вопросы на основе информации которую он услышал у других людей. Например спросил меня, хожу ли я на выставки DAC, где все говорят что тулы (средства проектирования) ограничивают сложность дизайнов. Я ответил что хожу на эту выставку с 1996 года, и тогда тоже все так говорили. Спросил у меня, слышал ли я о Chisel. Ответил "его используют только SiFive и Беркли. То что Chisel за 10 лет не проник в другие компании - означает что он ничего принципиально не решает". Итд.

Я не понимаю - что человек пытается достичь тусованием и такими вопросами? Какая часть фразы "пока вы сами не попробуете решать микроархитектурные задачи на верилоге, вы не будете понимать что вам говорят люди о проблемах такой разработки" - какая часть этой фразы ему непонятна?

Единственная гипотеза которая приходит мне в голову - человек пытается с помощью тусования найти технических людей, которых потом перепродать VC, то есть возглавить стартап и получить под них инвестии от венчурных капиталистов. Проблема с такой идеей: для технического человека ясно-понятно, что кроме тусования у этого джентльмена ничего значимого нет, то есть такой скрипач не нужен. С таким же успехом технический человек может сам пойти к VC.

Причем это еще лучше чем технический человек понимают сами VC - они сразу идентифицируют и стараются выкинуть из сделки такого рода бессмысленных посредников.

Но возможно я усложняю и человек тусованием просто решает какие-то психологические проблемы или это для него что-то типа путешествий которые любит молодежь.

Теги:
Всего голосов 16: ↑12 и ↓4+13
Комментарии5

AMD заботится о будущем, выпуская продукты для платформ из прошлого

Компания AMD выпустила процессор Ryzen 5 5500X3D с разъёмом AM4. Это теоретически позволяет установить его в системные платы 2017 года.

Зачем это пользователям — понятно. Они смогут оживить свои старые системы, используя в них современный процессор. Подозреваем, что клиентами будут не только и не столько игроки (AMD рассчитывает на Enthusiast Desktop — переводите, как хотите), как корпоративные пользователи и учёные, для которых возможность понять производительность процессора, сохранив старую систему, важнее использования более быстрой архитектуры Zen 4. Процессор Ryzen 5 5500X3D построен на предыдущей архитектуре Zen3, имеет 6 ядер с частотой от 3 ГГц и поддерживает память DDR4 и т.п. Обратим внимание, что данное ЦП не имеет встроенного видеоядра, так что придётся использовать прежнюю видеокарту.

Кто сможет использовать новый процессор? В первых новостях говорилось, что процессор можно будет использовать на системах с разъёмом АМ4. Но на сайте указаны чипсеты, поддерживающие процессор, — X570, X470, X370, B550, B450, B350, A520. Даже если у вас плата с таким чипсетом, скорее всего, использование процессора потребует обновление BIOS, так что в выигрыше окажутся владельцы продуктов, которые разработчики долго поддерживают. Кроме того, на сайте AMD указано, что процессор предназначен для Латиноамериканского сегмента, но, думаем, в России уже не привыкать использовать устройства со всего света.

Зачем это компании AMD? Компания взяла за практику продлять жизнь платформ ещё со времён 486 процессоров. Если на тот момент это была возможность не вкладываться в разработку новых платформ, то теперь это выглядит скорее как забота о пользователях. Компания так поступает во всех сегментах, например, в 2023 году AMD продлила жизненный цикл серверных процессоров EPYC Milan.

Конечно, может возникнуть впечатление, что таким образом AMD подрубает себе текущие продажи, но это маловероятно. В 2017 году доля процессоров этой компании на рынке составляла всего 13%. Вряд ли многие среди тех покупателей до сих пор имеют системы на АМ4 и откажутся от её обновления только из-за нового процессора. Зато AMD такими «недорогими» шагами борется за возвращение своей доли на рынке настольных ПК. В 2023 году она достигла 29,5%, но в следующем году упала до 24%. Видимо, усилия Пата Гелсингера и его последователей — сотрудничество с TSMC и переход на новые техпроцессы — наконец позволили стабилизировать спрос на Intel.

Что ж, всё пользователю на пользу.

Теги:
Всего голосов 17: ↑17 и ↓0+27
Комментарии0