Правильно використати SIMD C++
300 UAHКод весь написаний, треба тільки два метода виправити: який рахує за допомогою SSE, який рахує за допомогою AVX.
Є імплементація алгоритму на чистому CPU, але не вдається використати правильно з SSE i AVX, помилка десь криється в тому, що не правильно використовую або адресну арифметику або власне не враховую інші ньюанси SIMD. Необхідно, щоб після виправлення помилок в реалізації методу з sse i окремо з avx всі три варіанти (cpu, sse, avx) повертали оданковий правильний результат (написано все - від задання, запису в файл, порівняння і тд. потрібно лише правильно імплементувати векторизацію). Сам алгоритм ось:
Проект також прикріпив. Розбирався би сам, але дедлайн до завтра, а помилку ніяк знайти не можу.
До речі, на стаковерфлов такий коментар до мого питання дали: «*(pInputSignal + i - j) is incorrect in case of SSE, because it's not an i-j offset away from current value, it's (i-j) * 4 . THe thing is, as I remember it, the idea of using pointer that way is incorrect unless intrinsics had changed since then - in my time one had to "load" values into an instance of __m128 in this case, as H(J) and X(I-J) are in unaligned location (and sequence breaks).» тобто що помилка саме в тому місці, вот)
Приложения 1
Актуальные фриланс-проекты в категории C и C++
Консультация и аудит текущего проекта на Odoo 19 Community EditionИщем Odoo разработчика — соло-разработчика с опытом разработки на Odoo 19 Community Edition, в том числе с использованием Claude Code. Нам нужен специалист, который успешно реализовал проекты в Odoo и имеет практический опыт разработки с использованием Claude Code. Важно:… C и C++, Javascript и Typescript ∙ 10 часов 21 минута назад ∙ 5 ставок |
Создание или доработки прошивки и логики под три автономных LoRa-станций на базе ESP32.
5000 UAH
создание или доработки прошивки и логики под три автономных LoRa-станций на базе ESP32. Устройства должны поднимать Wi-Fi точку доступа, отдавать локальный сайт через браузер (HTTP), принимать текст и изображения в радиусе 5-10 км(плюс минус), сохранять данные (желательно на… C и C++, C# ∙ 12 часов 44 минуты назад ∙ 3 ставки |
Разработка ПО для Arduino (RF-модули 3–7.5 ГГц, автоматическое сканирование частот)Необходимо разработать систему на Arduino для автоматического поиска активного аналогового видеосигнала и автоматической настройки передатчика на обнаруженную частоту.Планируется использование трех отдельных приемно-передающих модулей: 3000–4200 МГц; 4900–6000 МГц; 6100–7500… C и C++, Встраиваемые системы и микроконтроллеры ∙ 1 день 11 часов назад ∙ 4 ставки |
Чёрная Украина (RP-проект на базе MTA)
51 669 UAH
|
Инженер по инфраструктуре резидентных проксиМы строим сеть резидентных прокси с нуля — полностью собственную, без сторонних поставщиков. Нам нужен один исключительный сетевой инженер для создания всей технической базы. Что вы будете строить: - Android SDK для фонового использования, который направляет прокси-трафик через… C и C++, DevOps ∙ 7 дней 7 часов назад ∙ 13 ставок |