Правильно використати SIMD C++
7 USDКод весь написаний, треба тільки два метода виправити: який рахує за допомогою SSE, який рахує за допомогою AVX.
Є імплементація алгоритму на чистому CPU, але не вдається використати правильно з SSE i AVX, помилка десь криється в тому, що не правильно використовую або адресну арифметику або власне не враховую інші ньюанси SIMD. Необхідно, щоб після виправлення помилок в реалізації методу з sse i окремо з avx всі три варіанти (cpu, sse, avx) повертали оданковий правильний результат (написано все - від задання, запису в файл, порівняння і тд. потрібно лише правильно імплементувати векторизацію). Сам алгоритм ось:
Проект також прикріпив. Розбирався би сам, але дедлайн до завтра, а помилку ніяк знайти не можу.
До речі, на стаковерфлов такий коментар до мого питання дали: «*(pInputSignal + i - j) is incorrect in case of SSE, because it's not an i-j offset away from current value, it's (i-j) * 4 . THe thing is, as I remember it, the idea of using pointer that way is incorrect unless intrinsics had changed since then - in my time one had to "load" values into an instance of __m128 in this case, as H(J) and X(I-J) are in unaligned location (and sequence breaks).» тобто що помилка саме в тому місці, вот)
Applications 1
Current freelance projects in the category C & C++
Comparative analysis of the effectiveness of custom software (v2.2-field) and reference software (Meshtastic v2.x)
22 USD
Comparative analysis of the effectiveness of custom software (v2.2-field) and reference software (Meshtastic v2.x) on the identical hardware platform (ESP32 + SX1268, 2W) based on the criteria of range, throughput, link stability, and power consumption. Conduct tests with… C & C++, C# ∙ 11 hours 49 minutes back ∙ 2 proposals |
Consultation and audit of the current project on Odoo 19 Community EditionWe are looking for an Odoo Developer — a solo developer with experience in Odoo 19 Community Edition, including using Claude Code. We need a specialist who has successfully implemented projects in Odoo and practical experience in development using Claude Code. Important: we only… C & C++, Javascript and Typescript ∙ 3 days 13 hours back ∙ 7 proposals |
Software development for Arduino (RF modules 3–7.5 GHz, automatic frequency scanning)It is necessary to develop a system on Arduino for the automatic search of active analog video signals and the automatic tuning of the transmitter to the detected frequency.It is planned to use three separate transceiver modules: 3000–4200 MHz; 4900–6000 MHz; 6100–7500… C & C++, Embedded Systems & Microcontrollers ∙ 4 days 13 hours back ∙ 4 proposals |
Black Ukraine (RP-project on base MTA)
1154 USD
|
Residential Proxy Infrastructure EngineerWe're building a residential proxy network from scratch — fully owned, no third-party suppliers. We need one exceptional network engineer to build the entire technical foundation. What you'll build: - Android background SDK that routes proxy traffic through user devices… C & C++, DevOps ∙ 10 days 9 hours back ∙ 15 proposals |