Switch to English?
Yes
Переключитись на українську?
Так
Переключиться на русскую?
Да
Przełączyć się na polską?
Tak
Opublikuj swoje zlecenie za darmo i otrzymaj oferty od wykonawców freelancerów już minutę po opublikowaniu!

Potrzebne oprogramowanie do przepisywania tekstu, może być bez interfejsu

Translated90 PLN

  1. 1444    9  0
    4 dni327 PLN

    Witam!
    Chętnie podejmę się realizacji Twojego projektu.

    Ostatnio pracowałem nad podobnym rozwiązaniem — systemem przetwarzania wideo z rozpoznawaniem i parafrazowaniem tekstu. Twoje zadanie jest całkowicie wykonalne w trybie lokalnym:

    bez zewnętrznych usług,

    z użyciem GPU (obsługa Twojej RTX 4060 zapewni znaczące przyspieszenie),

    obsługa wielu języków (rosyjski, angielski, hiszpański, niemiecki, włoski, polski — można zorganizować, ustalimy szczegóły),

    efekt — wysokiej jakości przeredagowanie tekstu z poziomem unikalności 90–95% i zachowaniem sensu oraz tonu oryginału.

    Program będzie:
    📁 automatycznie przetwarzać wszystkie filmy z folderu input,
    📝 wyodrębniać i rozpoznawać mowę,
    🔁 dokonywać parafrazy i zmian strukturalnych tekstu,
    📁 zapisywać wynik w output.

    Chciałbym doprecyzować:

    Średnią długość filmu (wskazałeś do 12 godzin — trzeba omówić techniczne limity).

    Maksymalną liczbę filmów na jedno uruchomienie.

    Porozmawiajmy o szczegółach w prywatnej wiadomości — opowiem, które opcje są najbardziej optymalne do pracy lokalnej.

    Czekam na Twoją wiadomość!

  2. 2065    32  0
    5 dni653 PLN

    Witam!
    Dokładnie zapoznałem się z Twoim technicznym opisem — i mogę zaproponować realizację autonomicznej aplikacji desktopowej dla Windows, która będzie wykonywać pakietowe rerenowowanie tekstu z filmów wideo, bez korzystania z usług zewnętrznych (wszystko lokalnie, z możliwością przyspieszenia przez GPU NVIDIA RTX 4060).

    Co będzie zawarte w rozwiązaniu:

    Pakietowe przetwarzanie:

    Przesyłasz pliki wideo do folderu input.

    Na wyjściu w folderze output otrzymujesz unikalne teksty.

    Ekstrakcja audio i transkrypcja:

    Używam lokalnego modelu (np. Whisper CPP lub Faster-Whisper z obsługą CUDA) do wysokiej jakości rozpoznawania mowy, w tym długich filmów do 12 godzin.

    Obsługiwane języki: rosyjski, angielski, niemiecki, hiszpański, włoski, polski (możliwość rozszerzenia listy do omówienia).

    Rerenowowanie tekstu:

    Automatyczne parafrazowanie (lokalnie) z uwzględnieniem:

    Synonimizacji.

    Przestawiania i upraszczania zdań.

    Zachowania stylu i intonacji oryginału.

    Zapewniania unikalności na poziomie 90–95%.

    Używam jednej z nowoczesnych modeli językowych z lokalną integracją (np. Mistral, Gemma, LLaMA, OpenHermes, lub specjalistycznych modeli do paraphrasingu) — GPU będzie wykorzystywany w pełni.

    Prosty interfejs użytkownika (opcjonalnie):

    Możliwość wyboru języka wejścia/wyjścia.

    Ustawienia głębokości rerenowowania (równowaga między dokładnością a unikalnością).

    Pasek postępu i log błędów.

  3. 3092    11  0
    1 dzień163 PLN

    Dzień dobry!
    Tworzę oprogramowanie w Pythonie!
    Tworzyłem podobne oprogramowanie do transkrypcji plików audio na tekst z akceptowalną jakością przetwarzania.
    Chciałbym omówić szczegóły projektu, jestem pewien, że będę mógł Ci pomóc.

  4. 834    8  0
    5 dni490 PLN

    Cena może być niższa lub wyższa w zależności od Twoich potrzeb.
    Napisz do mnie, aby omówić szczegóły.

    Napisałem orientacyjny stos technologiczny dla tego:

    Python 3.11+

    przetwarzanie wideo/ audio (ffmpeg, moviepy),

    rozpoznawanie mowy (Whisper),

    NLP - przeredagowywanie (LLM, Transformers),

    GUI (PyQt, Tkinter),

    GPU - obliczenia (CUDA przez PyTorch).

    ---------------------

    Whisper (offline do zamiany mowy na tekst)
    Model: whisper-large-v3 od OpenAI (przez CTranslate2 dla GPU).

    Zalety:

    Działa lokalnie.

    Obsługuje wielojęzyczność (RU, EN, DE, IT, ES, PL i inne).

    Przyspieszenie GPU.

    Interfejs: przez faster-whisper lub ct2-transformers.

    ---------------------------
    Model: Mistral 7B, LLaMA 3, lub podobny (przez GGUF/GGML)
    Działa offline przez llama.cpp, text-generation-webui lub llm CLI.

    Format: GGUF (dla efektywnej pamięci RAM generacji).

    Interfejs: llama-cpp-python lub lokalny serwer.

    Alternatywa:

    Vicuna / Nous Hermes / Zephyr / Mixtral (dobierane dla lepszego przeredagowania).

    Język wyjścia — jak w wejściowym wideo.

    --------------------

    ffmpeg (wyodrębnianie audio z wideo, cięcie dużych plików)

    moviepy (opcjonalnie — do uzyskania klatek, jeśli potrzebne)

    -------------------
    CUDA + PyTorch — dla modeli przeredagowywania i transkrypcji.

    CTranslate2 — umożliwia uruchomienie Whisper na GPU.

    llama.cpp z CUDA/CLBlast — do uruchamiania modeli LLaMA/Mistral na GPU.

    -------------
    Dodanie automatycznego wykrywania języka z audio (langdetect, whisper autodetect).

    Możliwość tłumaczenia (argos-translate offline, jeśli trzeba konwertować języki).

  5. 726    9  1
    3 dni98 PLN

    Witam! Zapoznałem się z projektem i jestem gotowy do pracy. Jestem pewien, że będziesz zadowolony z efektu.

  6. Jeszcze 2 ofert jest ukrytych

Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe

Automatyczne publikowanie relacji na Instagramie

Dzień dobry, Potrzebna pomoc w ustawieniu automatycznego publikowania historii na Instagramie. W archiwum Instagrama są już historie, które zostały opublikowane, trzeba je ponownie opublikować.

AI i uczenie maszynoweTworzenie chatbota ∙ 1 dzień 1 godzina temu ∙ 23 oferty

Stworzenie asystenta AI do komunikacji z klientami

Potrzebne jest stworzenie asystenta AI do komunikacji z Klientami. Okno czatu będzie umieszczone na naszej stronie, następnie nastąpi komunikacja z botem. Pytania dotyczące produktów, ustawień, możliwości itp. W przypadku, gdy informacja jest nieznana lub zapytanie, na które…

AI i uczenie maszynoweAI consult ∙ 1 dzień 21 godzin temu ∙ 33 oferty

Szukam montażysty wideo, który tworzy filmy z AI

Tworzenie wideo AI dla dentystów i innych ekspertów Cel: Tworzenie krótkich pionowych wideo dla Instagram Reels, Facebook Reels, TikTok i YouTube Shorts, które wyjaśniają skomplikowane tematy prostym językiem i przyciągają uwagę widza dzięki połączeniu animacji AI i wideo…

AI i uczenie maszynowe ∙ 2 dni 4 godziny temu ∙ 2 oferty

Szukam mentora / nauczyciela z ComfyUI do nauki online (praca przez RunPod)

57 PLN

Dzień dobry. Szukam praktykującego specjalisty i mentora, który pomoże mi opanować pracę z ComfyUI. Główną cechą mojego zapytania jest to, że praca będzie odbywać się całkowicie w chmurze, bez pobierania programu na lokalny komputer. Planuję wynająć kartę graficzną przez serwis…

AI i uczenie maszynowe ∙ 2 dni 15 godzin temu ∙ 1 oferta

Agent AI technologii żywienia sportowego

Agent pomaga opracowywać receptury nowych produktów sportowej żywności — batoników proteinowych, protein, przedtreningowych, izotonicznych, batoników itd. Główną cechą jest to, że agent zna przepisy prawne różnych krajów i automatycznie uwzględnia je przy tworzeniu receptury. To…

AI i uczenie maszynoweProgramowanie stron internetowych ∙ 2 dni 15 godzin temu ∙ 62 oferty

Zleceniodawca
Zlecenie zostało opublikowane
1 rok temu
117 wyświetleń
Tagi
  • ffmpeg
  • nlp
  • python