Правильно використати SIMD C++
300 UAHКод весь написаний, треба тільки два метода виправити: який рахує за допомогою SSE, який рахує за допомогою AVX.
Є імплементація алгоритму на чистому CPU, але не вдається використати правильно з SSE i AVX, помилка десь криється в тому, що не правильно використовую або адресну арифметику або власне не враховую інші ньюанси SIMD. Необхідно, щоб після виправлення помилок в реалізації методу з sse i окремо з avx всі три варіанти (cpu, sse, avx) повертали оданковий правильний результат (написано все - від задання, запису в файл, порівняння і тд. потрібно лише правильно імплементувати векторизацію). Сам алгоритм ось:
Проект також прикріпив. Розбирався би сам, але дедлайн до завтра, а помилку ніяк знайти не можу.
До речі, на стаковерфлов такий коментар до мого питання дали: «*(pInputSignal + i - j) is incorrect in case of SSE, because it's not an i-j offset away from current value, it's (i-j) * 4 . THe thing is, as I remember it, the idea of using pointer that way is incorrect unless intrinsics had changed since then - in my time one had to "load" values into an instance of __m128 in this case, as H(J) and X(I-J) are in unaligned location (and sequence breaks).» тобто що помилка саме в тому місці, вот)
Додатки 1
Актуальні фриланс-проєкти в категорії C та C++
Порівняльний аналіз ефективності кастомного ПЗ (v2.2-field) та еталонного ПЗ (Meshtastic v2.x)
1000 UAH
Порівняльний аналіз ефективності кастомного ПЗ (v2.2-field) та еталонного ПЗ (Meshtastic v2.x) на ідентичній апаратній платформі (ESP32 + SX1268, 2W) за критеріями дальності, пропускної спроможності, стабільності лінка та енергоспоживання. Провести тести з вимірюваннями з… C та C++, C# ∙ 18 годин 46 хвилин тому ∙ 2 ставки |
Консультація та аудит поточного проєкту на Odoo 19 Community EditionШукаємо Odoo Developer — соло-розробника з досвідом розробки на Odoo 19 Community Edition, у тому числі за допомогою Claude Code. Нам потрібен спеціаліст, який має успішно реалізовані проєкти в Odoo та практичний досвід розробки з використанням Claude Code. Важливо: розглядаємо… C та C++, Javascript та Typescript ∙ 3 дні 19 годин тому ∙ 7 ставок |
Розробка ПЗ для Arduino (RF-модулі 3–7.5 ГГц, автоматичне сканування частот)Потрібно розробити систему на Arduino для автоматичного пошуку активного аналогового відеосигналу та автоматичного налаштування передавача на виявлену частоту.Планується використання трьох окремих приймально-передавальних модулів: 3000–4200 МГц; 4900–6000 МГц; 6100–7500… C та C++, Вбудовані системи та мікроконтролери ∙ 4 дні 20 годин тому ∙ 4 ставки |
Чорна Україна (RP-проект на базі MTA)
51 355 UAH
|
Інженер інфраструктури резидентних проксіМи будуємо мережу резидентних проксі з нуля — повністю власну, без сторонніх постачальників. Нам потрібен один винятковий мережевий інженер, щоб побудувати всю технічну основу. Що ви будете будувати: - Android фоновий SDK, який маршрутизує проксі-трафік через пристрої… C та C++, DevOps ∙ 10 днів 16 годин тому ∙ 15 ставок |