Kompleks oprogramowania do interakcji głosowej z użytkownikami oparty na OpenAI + komputerze jednopłytkowym
Opis zadania:
Należy stworzyć kompleks oprogramowania, który znacznie poprawia doświadczenie użytkownika w interakcji z urządzeniami wydającymi towary firmy.
To rozwiązanie ma stać się interfejsem do komunikacji głosowej z klientami, który działa na podstawie produktów OpenAI (Whisper, TTS, GPT) i jest wspierany przez dwa poziomy architektury:
🧩 1. Lokalny moduł (na każdym urządzeniu):
Umieszczony na jednopłytowym komputerze (na przykład Raspberry Pi lub jego odpowiedniku),
Podłącza:
🎙️ mikrofon do nagrywania głosu,
🔊 głośnik do odtwarzania odpowiedzi,
📸 kamerę do rozpoznawania twarzy,
⚙️ przekaźnik lub kontroler do otwierania szufladki urządzenia.
Zainstalowany system operacyjny (Linux/Ubuntu/Raspberry Pi OS) oraz program, który:
Określa ruch użytkownika (poprzez czujnik),
Włącza kamerę i mikrofon,
Przeprowadza rozpoznawanie twarzy,
Komunikuje się z użytkownikiem poprzez interfejs głosowy:
Rozpoznaje mowę za pomocą Whisper API,
Określa scenariusz komunikacji za pomocą centralnego promptu,
Otrzymuje odpowiedzi od GPT i odtwarza je za pomocą TTS,
Rejestruje wszystkie zdarzenia i synchronizuje je z centralną bazą.
🌐 2. Usługa chmurowa (centralny backend):
Zawiera jedną bazę wszystkich użytkowników, twarzy, historii zakupów i transakcji,
Ma mechanizm centralnego zarządzania promptami, który określa logikę dialogu botów w każdym urządzeniu,
Synchronizuje się ze wszystkimi terminalami:
Codzienna transmisja danych z chmury → lokalne urządzenia,
Natychmiastowa aktualizacja chmury → po rejestracji nowego użytkownika.
🎯 Jak działa system:
Użytkownik podchodzi → czujnik ruchu aktywuje urządzenie,
Kamera identyfikuje twarz → jeśli nie znaleziono — proponowana jest rejestracja,
Rozpoczyna się dialog głosowy, zbudowany na zasadach z promptu:
Rozpoznawanie za pomocą Whisper,
Odpowiedź GPT (w kontekście danych osobowych/historii klienta),
Odtwarzanie za pomocą TTS,
Jeśli użytkownik jest nowy → natychmiast dodawany do bazy chmurowej,
System uwzględnia ten fakt w czasie rzeczywistym, kończy dialog i wykonuje:
rejestrację,
wydanie produktu promocyjnego,
lub inne działania marketingowe (zgodnie ze scenariuszem).
🛠️ Należy zrealizować:
Lokalny program na jednopłytowym PC (na przykład Raspberry Pi),
Interfejs głosowy (STT + GPT + TTS),
Przetwarzanie rozpoznawania twarzy (OpenCV / face_recognition),
Lokalna baza użytkowników + dziennik zdarzeń,
Synchronizacja z bazą chmurową (REST API lub WebSocket),
Centralizowana usługa chmurowa z:
CRM dla użytkowników i zdarzeń,
zarządzaniem globalnymi promptami,
możliwością wprowadzania zmian z jednego PC na wszystkie terminale.
💡 To rozwiązanie ma być przydatne dla:
Całkowitej automatyzacji obsługi użytkowników,
Uruchomienia akcji "1 zł za rejestrację" lub "Prezent dla stałego klienta",
Inteligentnego zarządzania towarem na podstawie typu klienta,
Szczegółowego rejestrowania wszystkich działań z przypisaniem do osoby.
⚙️ Technologie (zalecane):
Python, FastAPI / Flask,
OpenAI API (Whisper, GPT, TTS),
SQLite/PostgreSQL,
Raspberry Pi OS / Ubuntu,
face_recognition + OpenCV,
Docker (dla mikroserwisów),
USB Relay / GPIO do zarządzania szufladkami.
⏱️ Termin realizacji:
2–4 tygodnie.
(Możliwa realizacja etapami: MVP → integracja → skalowanie)
-
310 2 1 Cześć! 👋
Zainteresował mnie Twój projekt — to właśnie ten przypadek, kiedy łączą się technologie przyszłości z rzeczywistym przypadkiem biznesowym 💡
🔹 Ja/Mój zespół mamy głębokie doświadczenie w opracowywaniu systemów embedded na Raspberry Pi, pracy z OpenAI API (Whisper, GPT-4, TTS), a także w tworzeniu infrastruktury chmurowej (FastAPI + PostgreSQL, Docker, WebSocket/REST API).
🔧 Co możemy zrealizować:
✅ 1. Lokalny moduł (terminal na Raspberry Pi):
🎤 Podłączenie mikrofonu + Whisper API (rozpoznawanie mowy)
📢 Odczyt odpowiedzi przez TTS
… 📷 Rozpoznawanie twarzy (face_recognition + OpenCV)
📦 Sterowanie przekaźnikiem / GPIO (otwieranie szuflady)
👁️ Czujnik ruchu → aktywacja sesji
💾 Lokalna baza użytkowników + cache logów/sesji
🔄 Synchronizacja z chmurą (REST/WebSocket)
✅ 2. Usługa chmurowa:
🌐 FastAPI + PostgreSQL
🔑 Jedna baza użytkowników (ID + zdjęcie + historia transakcji)
🧠 Centralne zarządzanie promptami GPT + aktualizacja logiki
📈 Panel CRM (interfejs webowy) do przeglądania logów/wydarzeń/analizy
⚙️ Masowe aktualizacje danych na terminalach
🔐 Poziomy dostępu dla administratorów
💬 Jak to będzie działać:
Użytkownik podchodzi → czujnik aktywuje kamerę + mikrofon
Twarz jest rozpoznawana (lub rejestrowana nowa)
Rozpoczyna się dialog głosowy (Whisper → GPT → TTS)
Jeśli to konieczne — otwierana jest szuflada / wysyłana jest promocja
Całe zdarzenie jest rejestrowane w logach i przesyłane do chmury
📦 MVP w ciągu 2–4 tygodni:
Możliwa etapowa realizacja:
MVP dla 1 urządzenia → test → skalowanie do sieci.
💬 Dodatkowo:
Zapewniamy wsparcie techniczne po wydaniu
Oferujemy wygodny panel administracyjny (dostęp z PC/tabletu)
Pomożemy w zakupie/konfiguracji Pi i peryferiów
🔹 Jesteśmy gotowi omówić szczegóły, zaproponować architekturę, sprinty i zapytać o wszystko, co potrzebne — napisz lub podaj kontakt.
Projekt wygląda niezwykle interesująco i obiecująco 🚀
-
6501 229 4 7 Witaj
Ciekawe zadanie.
Pisz w wiadomościach prywatnych.
Omówimy szczegóły.
-
726 9 1 Cześć! Zapoznałem się z twoim projektem i jestem gotów zacząć pracę. Gwarantuję wysoką jakość i szybkie wykonanie.
-
8773 60 0 1 Dzień dobry. Gotowy do wykonania.
Mam duże doświadczenie w realizacji projektów AI.
Głównie piszę w Pythonie, zajmuję 2. miejsce na platformie.
Opracuję system poprawiający doświadczenia użytkowników w interakcji z automatami do wydawania towarów. Zrealizuję niezbędną funkcjonalność. Podłączę integracje. Skonfiguruję i nauczę model AI. Opracuję oprogramowanie dla lokalnego modułu i chmurowej usługi. Skonfiguruję i zoptymalizuję niezbędne elementy interakcji (kamera, mikrofon).
Zrealizuję pełną automatyzację wszystkich procesów. Przetestuję i dostarczę niezbędną dokumentację.
Moje portfolio:Freelancehunt
Piszcie, omówimy i przystąpię do pracy.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Inżynier AI/NLP z silnym doświadczeniem w przetwarzaniu dokumentów medycznych.Szukamy doświadczonego inżyniera AI/NLP z silnym doświadczeniem w przetwarzaniu dokumentów medycznych.Nasz projekt obejmuje rozpoznawanie, analizowanie i strukturalną analizę dokumentów medycznych, szczególnie dokumentów SNF / długoterminowej opieki oraz ocen MDS. Celem jest… AI i uczenie maszynowe ∙ 2 godziny 46 minut temu ∙ 6 ofert |
Stworzyć wtyczkę do Chrome, do łączenia z proxyStworzyć wtyczkę do Chrome, do łączenia z proxy szukam programisty, możliwe + AI który już publikował podobne wtyczki w sklepie z sukcesem po prostu AI pisanie bez doświadczenia w programowaniu nie jest potrzebne proszę o oferty cenowe, terminy AI i uczenie maszynowe, Programowanie stron internetowych ∙ 5 godzin 51 minut temu ∙ 24 oferty |
Należy przenieść stronę z Figma + Webflow na kod, możliwie z AITrzeba przenieść stronę z Figma + Webflow na kod, możliwe z AI Jeśli można to zrobić z AI, z 100% dokładnością i bez błędów, lepiej to zrobić z nimi napisz cenę i jakie miałeś doświadczenie w tej konkretnej zadaniu AI i uczenie maszynowe, AI graphic ∙ 5 godzin 53 minuty temu ∙ 22 oferty |
Twórca Wideo AI i Artysta 3D dla Innowacyjnego Projektu AI-EdTech (Radaastrea): Szukamy artysty 3D / twórcy wideo AI do innowacyjnego projektu AI-EdTech (Radaastria)Opis: Tworzymy rozbudowaną franczyzę medialną i koncepcję empatycznego robota AI nowej generacji dla nastolatków — RADAASTRIA. Obraz — mądra i jasna 7-letnia dziewczynka, łącząca w sobie boską… AI i uczenie maszynowe, Tworzenie gier ∙ 1 dzień 1 godzina temu ∙ 1 oferta |
Przegląd architektury i wdrożenia N8nJęzyk Nasza ekipa techniczna mówi po angielsku, rosyjsku i niemiecku. Możesz wybrać dowolny z tych języków dla swojego tekstu i rozmowy przeglądowej. CelObsługujemy gotowe do produkcji AI i przepływy dokumentów w n8n Cloud, które integrują Salesforce z LLM i usługami… AI i uczenie maszynowe, AI consult ∙ 1 dzień 5 godzin temu ∙ 14 ofert |