Правильно використати SIMD C++
25 PLNКод весь написаний, треба тільки два метода виправити: який рахує за допомогою SSE, який рахує за допомогою AVX.
Є імплементація алгоритму на чистому CPU, але не вдається використати правильно з SSE i AVX, помилка десь криється в тому, що не правильно використовую або адресну арифметику або власне не враховую інші ньюанси SIMD. Необхідно, щоб після виправлення помилок в реалізації методу з sse i окремо з avx всі три варіанти (cpu, sse, avx) повертали оданковий правильний результат (написано все - від задання, запису в файл, порівняння і тд. потрібно лише правильно імплементувати векторизацію). Сам алгоритм ось:
Проект також прикріпив. Розбирався би сам, але дедлайн до завтра, а помилку ніяк знайти не можу.
До речі, на стаковерфлов такий коментар до мого питання дали: «*(pInputSignal + i - j) is incorrect in case of SSE, because it's not an i-j offset away from current value, it's (i-j) * 4 . THe thing is, as I remember it, the idea of using pointer that way is incorrect unless intrinsics had changed since then - in my time one had to "load" values into an instance of __m128 in this case, as H(J) and X(I-J) are in unaligned location (and sequence breaks).» тобто що помилка саме в тому місці, вот)
Załączniki 1
Aktualne zlecenia dla freelancerów w kategorii C i C++
Nie przychodzą maile o zamówieniach i zgłoszeniach z witryny
57 PLN
Wymagana jest diagnostyka i usunięcie problemu z powiadomieniami e-mail na stronie OpenCart. Obecnie nie przychodzą powiadomienia na e-mail dotyczące następujących zdarzeń: nowe zamówienia; wnioski o oddzwonienie; komentarze pozostawione przez użytkowników; pytania i odpowiedzi… C i C++, Bazy danych i SQL ∙ 5 godzin 23 minuty temu ∙ 14 ofert |
Konsultacja i audyt bieżącego projektu na Odoo 19 Community EditionSzukamy programisty Odoo — samodzielnego dewelopera z doświadczeniem w pracy z Odoo 19 Community Edition, w tym z wykorzystaniem Claude Code. Potrzebujemy specjalisty, który ma zrealizowane projekty w Odoo oraz praktyczne doświadczenie w programowaniu z użyciem Claude Code.… C i C++, Javascript & Typescript ∙ 1 dzień 18 godzin temu ∙ 5 ofert |
Tworzenie lub modyfikacja oprogramowania i logiki dla trzech autonomicznych stacji LoRa opartych na ESP32.
410 PLN
tworzenie lub modyfikacja oprogramowania i logiki dla trzech autonomicznych stacji LoRa opartych na ESP32. Urządzenia powinny uruchamiać punkt dostępu Wi-Fi, udostępniać lokalną stronę przez przeglądarkę (HTTP), odbierać tekst i obrazy w promieniu 5-10 km (plus minus),… C i C++, C# ∙ 1 dzień 20 godzin temu ∙ 3 oferty |
Rozwój oprogramowania dla Arduino (moduły RF 3–7,5 GHz, automatyczne skanowanie częstotliwości)Należy opracować system na Arduino do automatycznego wyszukiwania aktywnego analogowego sygnału wideo oraz automatycznego dostosowywania nadajnika do wykrytej częstotliwości.Planowane jest wykorzystanie trzech oddzielnych modułów odbiorczo-nadajnych: 3000–4200 MHz; 4900–6000… C i C++, Systemy wbudowane i mikrokontrolery ∙ 2 dni 18 godzin temu ∙ 4 oferty |
Czarna Ukraina (projekt RP na bazie MTA)
4233 PLN
|