Parser wiadomości
Potrzebuję stworzyć bota telegramowego, który będzie wysyłał mi wszystkie wiadomości w czasie rzeczywistym z zasobów internetowych, które podam (około 30) oraz z kanałów telegramowych (do 30). Ważne jest, aby przetwarzał wszystko i wysyłał tylko unikalne wiadomości bez powtarzania ich wiele razy.
-
Cześć.
Zapoznałem się z zadaniem. Mogę zrealizować dla Ciebie bota do monitorowania wiadomości w czasie rzeczywistym, zbierającego dane z witryn i kanałów Telegram oraz filtrującego duplikaty.
Z mojej strony mogę zrealizować:
zbieranie wiadomości z do 30 witryn;
podłączenie do 30 kanałów Telegram;
…
filtrowanie powtórzeń nie tylko po dokładnym tekście, ale także po podobnych wiadomościach;
przesyłanie tylko unikalnych wiadomości do Twojego Telegramu;
podstawową logikę stabilnej pracy, obsługę błędów i możliwość dalszego rozszerzenia.
Prawidłowe podejście tutaj to nie tylko „parsowanie wszystkiego”, ale zbudowanie stabilnego konturu monitorowania, gdzie są:
źródła → przetwarzanie → sprawdzanie duplikatów → wysyłanie do Telegramu.
Tylko w ten sposób system będzie odpowiedni do stałego użytku, a nie tylko jako jednorazowy skrypt.
Pracuję z Pythonem, botami Telegram, parsowaniem, API i scenariuszami automatyzacji, więc mogę to zbudować jako zrozumiały MVP z normalną podstawą do dalszego rozwoju.
Termin: 5 dni
Koszt: 6 500 zł
Jestem gotów podjąć się realizacji.
-
Witam, proponuję realizację bota na stosie Node.js z wykorzystaniem OpenAI API do analizy treści.
-
Witam. Jestem gotów zrealizować takiego bota albo w n8n, albo w pythonie. Ale mimo to wasze TZ jest niewystarczające. Należy je bardziej szczegółowo opisać. W razie potrzeby mogę pomóc w stworzeniu szczegółowego TZ, jeśli go nie macie.
-
co oznacza unikalne? kto określa unikalność i według jakich parametrów? Zbyt wiele pytań do zadania. Powiedzcie, co chcecie uzyskać na wyjściu.
-
216 Dzień dobry, jestem gotów zrealizować ten projekt, mam doświadczenie w parsowaniu danych oraz w tworzeniu botów telegramowych. Piszcie, omówimy szczegóły.
-
163 Witam, jestem gotowy do szybkiej i jakościowej realizacji, już mam doświadczenie w tworzeniu takich botów z wykorzystaniem AI.
-
271 Witaj! Jestem programistą w Pythonie i dobrze rozumiem twój problem — czytanie 60 kanałów z tymi samymi wiadomościami jest niemożliwe. Stworzę bota, który przekształci ten chaos w jeden czysty i unikalny strumień.
-
168 Witaj! Jestem gotowy zrealizować dla Ciebie funkcjonalny agregator wiadomości Telegram. Mam doświadczenie w pracy z bibliotekami Telethon/Pyrogram (do monitorowania kanałów) oraz w opracowywaniu parserów dla stron internetowych.
Jak rozwiążę problem unikalności:
Abyś nie otrzymywał duplikatów wiadomości, wdrożę system porównywania treści na podstawie nagłówków i treści (haszowanie lub wektoryzacja tekstu), co pozwoli botowi "rozumieć", że wiadomość już była, nawet jeśli jest napisana innymi słowami.
Stos technologiczny:
Python + Aiogram/Pyrogram.
Baza danych (PostgreSQL lub SQLite) do przechowywania historii i wykluczania powtórzeń.
Konfiguracja serwera (VPS) do pracy bota w trybie 24/7.
-
3390 24 0 Dzień dobry.
Jestem gotowy do realizacji, mam duże doświadczenie w parsowaniu danych i tworzeniu botów telegramowych.
Piszcie, omówimy szczegóły.
-
667 5 0 Dzień dobry! Zainteresował mnie Państwa projekt.
Wcześniej realizowałem podobny system do przechwytywania i przeredagowywania wiadomości dla własnego kanału Telegram, dlatego mogę opracować rozwiązanie w pełnej zgodności z Państwa wymaganiami technicznymi. Mogę również zaproponować połączenie FuzzyWuzzy + OpenAI do efektywnego sortowania wiadomości, wykrywania duplikatów i automatycznego usuwania identycznych lub podobnych materiałów.
Posiadam również znaczące doświadczenie w następujących dziedzinach:
📊 Przetwarzanie danych — praca z bazami danych, strukturyzacja i analiza informacji, automatyzacja przetwarzania dużych zbiorów danych, import/eksport i walidacja danych.
🤖 Automatyzacja i emulacja działań użytkownika — tworzenie botów o różnym stopniu skomplikowania, automatyzacja rutynowych procesów.
⚡️ Asynchroniczne i wielowątkowe parsowanie — zbieranie i przetwarzanie danych z optymalizacją wydajności i szybkości.
… 🔍 OCR i wyszukiwanie tekstu — rozpoznawanie tekstu z obrazów i jego dalsza strukturyzacja.
🖼 Przetwarzanie mediów — praca z obrazami i treściami multimedialnymi.
🖥 Tworzenie oprogramowania — tworzenie aplikacji desktopowych, usług systemowych i serwisów.
📱 Rozwój mobilny — tworzenie aplikacji natywnych i wieloplatformowych.
🌐 Praca z API i zewnętrznymi serwisami — integracja, automatyzacja i wymiana danych między systemami.
🗣 Tłumaczenie i przetwarzanie tekstu — automatyzacja tłumaczenia, praca z modelami językowymi i analizą tekstu.
🤖 Rozwiązania AI/LLM — wdrażanie i wykorzystanie sztucznej inteligencji, praca z modelami językowymi i automatyzacja procesów inteligentnych.
Gwarantuję wysoką jakość i terminowe wykonanie pracy. Chętnie omówię szczegóły projektu, terminy i zaproponuję optymalne rozwiązanie — proszę o kontakt!
-
234 3 1 1 Dzień dobry, jestem gotów zrobić dla Państwa bota, co do ceny się dogadamy, będę zadowolony z współpracy.
-
2211 18 3 Cześć! Już realizowałem podobny projekt - bot do parsowania kanałów Telegram z automatycznym przesyłaniem i unikalizacją wiadomości. Jestem gotów szybko dostosować te rozwiązania do Twoich zadań.
Plan techniczny realizacji:
- Zbieranie danych: dla Telegram - Pyrogram (user-bot) do natychmiastowego przechwytywania postów. Dla stron internetowych - RSS lub niestandardowe parsery na BeautifulSoup.
- Filtrowanie duplikatów (AI): abyś nie otrzymywał tej samej wiadomości z różnych źródeł, skonfiguruję porównanie za pomocą wektorowych embeddingów. To pozwala AI rozumieć sens tekstu: jeśli trzy źródła pisały o jednym wydarzeniu różnymi słowami, bot wyśle tylko pierwszą wersję.
- Baza danych: użyję Redis do przechowywania hashy wiadomości z ostatnich 24-48 godzin dla szybkiej weryfikacji kopii.
Aby ocenić terminy, potrzebuję:
…
- Zapoznać się z listą zasobów internetowych (aby zrozumieć złożoność skrapowania).
- Czy AI ma robić krótki przegląd (summary) wiadomości, czy wysyłać oryginał?
Jestem gotów omówić szczegóły i rozpocząć, pisz.
-
159 Gotowy do działania!
Mogę zrealizować bota w Pythonie, który będzie parsował RSS-feed'y waszych stron i czytał kanały Telegram w czasie rzeczywistym. Wszystkie wiadomości będą sprawdzane pod kątem unikalności przed wysłaniem — powtórzenia są wykluczone. Zdeployuję na VPS, bot będzie działał w tle 24/7.
Aby rozpocząć pracę, potrzebuję listy stron i kanałów. Proszę również o wyjaśnienie — czy wystarczy usuwać dokładne duplikaty, czy należy także odrzucać wiadomości, które są napisane innymi słowami, ale dotyczą tego samego?
Napisz w wiadomościach prywatnych lub na Telegramie w moim CV, omówimy szczegóły!
-
1251 35 1 3 Witam Nikita, jestem gotów do wykonania. Pisz na priv, prześlij zasoby, omówimy TZ.
-
2138 22 2 cześć
taki system będzie kosztować od 500 dolarów.
piszcie, omówimy
-
249 11 0 2 Dzień dobry! Zapoznałem się z Twoim zadaniem. Obecnie mam odpowiedniego bota tg, który odpowiada temu, którego chcesz, ale zbiera dane z 5 stron w każdym kraju. Oto możesz się zapoznać: @TheGlobalNews_bot (teraz jest zamknięty, w razie potrzeby otworzę). Pisz, zrobię szybko i jakościowo! Na łączach!
-
417 2 0 Witaj
Git-hub
https://github.com/ambarexpressmarket-lab/demo-repo
Portfolio
Google Drive
-
726 9 1 Witaj! Twój projekt wzbudził moje duże zainteresowanie. Jestem gotów natychmiast rozpocząć pracę i zapewnić wysoką jakość wykonania.
-
8753 60 0 1 Witam!
Zrealizowałem wiele podobnych projektów dotyczących pisania botów tg.
Napisałem kilka swoich unikalnych narzędzi do parsowania.
Jestem gotów szybko i jakościowo wykonać twoje zadanie.
Zapoznaj się z moim portfolio.
Pisz!
Mam nadzieję na owocną współpracę.
-
208 3 0 Mam doświadczenie w takich zadaniach, będę w stanie zbierać wszystko i integrować AI. Proszę o kontakt!
-
284 Dzień dobry!
Zapoznałam się z Twoim pomysłem.
Aby zrealizować takiego bota, kluczowy jest PARSER NEWS
Możliwe, że część źródeł może mieć RSS lub otwarte API, ale nawet wtedy potrzebny jest parser, który stabilnie wyciągnie dane i przetworzy różne formaty. Dla kanałów Telegram logika jest podobna: jest API, ale do jakościowej pracy również potrzebny jest parser.
To wszystko mogę zrobić w Pythonie + GoLang.
A potem można bez problemu połączyć wszystkie źródła, usunąć duplikaty i wysyłać unikalne wiadomości do Twojego Telegrama w czasie rzeczywistym. Możemy podłączyć modele AI. Może nawet darmowe modele będą odpowiednie, możemy również używać najnowszych OpenAI, Claude, Gemini itd.
…
Parser jest tutaj sercem systemu — musi umieć pracować z różnymi źródłami, filtrować powtórzenia i zapewniać szybkość i stabilność. Należy go dokładnie przemyśleć i umieścić na serwerze.
Końcowy koszt zależy od złożoności parsera. Czy trzeba skonfigurować omijanie Captcha, czy potrzebny jest PlayWright itd.
Orientacyjna stawka — 200–600 USD, w zależności od tego, czy większość stron ma RSS/API, czy potrzebne jest niestandardowe parsowanie HTML i dodatkowe rozwiązania antydetekcyjne.
Ale być może uda nam się zrealizować wszystko nawet prościej (dlatego piszę podstawową stawkę, jeśli sam parser będzie prosty w realizacji).
Mam doświadczenie w Pythonie w automatyzacji procesów o profesjonalnej złożoności (pracuję zgodnie z standardami Google IT Automation with Python) oraz integracjach z Telegramem i API, dlatego mogę zaproponować Ci stabilne, skalowalne i profesjonalne rozwiązanie.
Pisz, wszystko omówimy. Z rezultatu będziesz zadowolony.
-
1423 46 0 Dzień dobry, jestem gotowa wykonać zadanie. Porozmawiajmy o szczegółach w wiadomościach prywatnych. Będę zadowolona ze współpracy!
-
3088 31 0 Witam! Mogę zrealizować ten projekt. Mam już pewne pomysły.
Jeśli to aktualne - pisz, omówimy.
-
727 6 0 cena ostateczna gotowy do wykonania, proszę się kontaktować
-
3367 84 0 Gotowy, aby się tym zająć. Ale trzeba rozumieć, że korzystanie z API AI będzie kosztować pieniądze. Trzeba zobaczyć zasoby, aby ocenić trudność pracy z nimi. Używam Pythona, uv, github, docker.
-
656 9 0 Dzień dobry, Nikita!
Ogólnie zadanie jest zrozumiałe, aby uzyskać dokładną odpowiedź na temat terminów i ceny, chciałbym wyjaśnić kilka kwestii, które pojawiły się po analizie twojego zadania.
Pisz w wiadomościach prywatnych – omówimy szczegóły i twoje życzenia.
-
2496 20 0 Dzień dobry, jestem gotowy wykonać twoje zadanie szybko i jakościowo. Mam duże doświadczenie w tworzeniu różnych parserów. Napisz w wiadomościach prywatnych, omówimy szczegóły. Chętnie pomogę)
-
1422 13 0 Witam.
Mogę stworzyć takiego bota. Mam doświadczenie z agregatorami wiadomości + filtracją AI.
Jak to będzie działać:
- podłączenie do stron (RSS lub parsowanie) + kanałów Telegram (Telethon)
- zbieranie wiadomości w czasie rzeczywistym
Przetwarzanie AI:
- czyszczenie tekstu
- wykrywanie duplikatów (semantyczne + podobieństwo tekstu)
… - wysyłanie tylko unikalnych wiadomości
Co otrzymasz:
- minimum spamu lub powtórzeń
- szybkie powiadomienia w Telegramie
- normalny czytelny format
Po liście źródeł podam dokładną cenę.
-
97 34 4 2 Dzień dobry
Jestem gotów wykonać
Ale mam pytanie dotyczące tego, jak zrozumieć, że artykuł to duplikat
-
834 4 0 Witaj!
Mam gotowe rozwiązanie do monitorowania wiadomości w czasie rzeczywistym, które już skutecznie działa. Możesz sprawdzić jakość zbierania i przetwarzania AI na przykładzie mojego działającego projektu: kanał telegramowy hlamnews2.
Realizacja techniczna twojego zapytania:
Monitorowanie (30 stron + 30 kanałów): Używam asynchronicznego parsowania (Python) dla stron oraz UserBot API (Telethon/Pyrogram) dla kanałów Telegram. To zapewnia otrzymywanie wiadomości w ciągu kilku sekund po ich publikacji.
Inteligentny antyduplikat (AI): Unikalność jest określana nie tylko na podstawie zgodności tekstu, ale za pomocą analizy semantycznej (wektorowe osadzenia lub porównania przez GPT-4o/Gemini). System rozumie, że różne teksty dotyczące tego samego wydarzenia to duplikaty i ich nie przepuszcza.
Infrastruktura: Projekt jest wdrażany w Dockerze, co gwarantuje stabilność 24/7. Wszystkie procesy są logowane, a zarządzanie listą źródeł jest przeniesione do wygodnej konfiguracji lub menu administracyjnego.
-
2409 8 1 Cześć!
Widzę, że potrzebujesz nie tylko bota do zbierania wiadomości, ale systemu rzeczywistego monitorowania z filtracją AI, który będzie odrzucał duplikaty i wysyłał tylko unikalne, przydatne wiadomości.
Co mogę zaoferować:
— zbieranie wiadomości w czasie rzeczywistym z stron internetowych i kanałów Telegram;
— przetwarzanie AI i antyduplikację, aby ta sama wiadomość nie przychodziła kilka razy;
— wygodne dostarczanie wybranych wiadomości do Ciebie na Telegram.
… Pracuję z Pythonem, botami Telegram, parsowaniem, API i przetwarzaniem treści AI, więc mogę stworzyć stabilne narzędzie, a nie tylko surowy parser.
Jestem gotów omówić źródła i od razu przystąpić do pracy nad zadaniem.
-
4028 11 0 2 Witaj. Jestem gotów zrealizować takiego bota Telegram na Pythonie. Mam doświadczenie w tworzeniu botów, parserów, pracy z API Telegrama, przetwarzaniu wiadomości i logice deduplikacji danych. Mogę stworzyć system, który będzie zbierał wiadomości w czasie rzeczywistym z wskazanych przez Ciebie zasobów internetowych i kanałów Telegram, analizować je za pomocą AI i wysyłać tylko unikalne wydarzenia bez ciągłych powtórzeń i duplikatów.
-
2141 85 0 Gotowy do zrobienia. _____________________________________________
-
4975 41 4 1 Dzień dobry!
Profesjonalnie rozwijam boty w Telegramie w Pythonie. Jestem gotów zrealizować dla Ciebie parser wiadomości z unikalnym filtrowaniem, wykorzystując API, web scraping i bazy danych, a także wdrożyć go na serwerze.
Napisz do mnie w wiadomości prywatnej, ustalimy szczegóły.
Aktualne zlecenia dla freelancerów w kategorii Parsowanie danych
Zeskanuje grupy na Telegramie
58 PLN
Należy zeskrobać telegramy grupy i posortować je według folderów. Potrzebne są grupy publiczne i prywatne. Wszystko, co jest w Polsce Parsowanie danych, Tworzenie chatbota ∙ 9 godzin 24 minuty temu ∙ 15 ofert |
Badanie segmentu premium KijowaBadanie segmentu premium w Kijowie Potrzebne jest przeprowadzenie poszukiwań otwartych publicznych kanałów komunikacji z przedstawicielami segmentu premium w Kijowie. Co należy zebrać: otwarcie opublikowany email lub telefon do kontaktu, jeśli jest umieszczony w publicznym… Parsowanie danych, Wyszukiwanie i zbieranie informacji ∙ 19 godzin 28 minut temu ∙ 12 ofert |
Wymagany specjalista ds. promocji w Telegramie.
107 PLN
Zadania: zapraszanie rzeczywistych użytkowników z bazy nazw użytkowników do nowych czatów oraz wysyłanie wiadomości do docelowej bazy. Interesuje nas tylko jakościowy ruch i praca z żywą publicznością — wykonawców korzystających z botów, sztucznego zwiększania lub niskiej… Parsowanie danych, Promocja w sieciach społecznościowych (SMM) ∙ 3 dni 14 godzin temu ∙ 8 ofert |
Zbieranie bazy danych B2B firm w Niemczech
149 PLN
Cel: Uzyskanie listy potencjalnych pracodawców (klientów) do wysyłki B2B. Region: Monachium (München) + promień 50 km. Wymagane nisze: Firmy budowlane (Bauunternehmen) Przemysł spożywczy (Lebensmittelhersteller, zakłady mięsne, piekarnie) Logistyka i kompleksy magazynowe… Parsowanie danych, Sprzedaż i generowanie leadów ∙ 3 dni 16 godzin temu ∙ 34 oferty |
Konsultacja dotycząca parsowania subskrybentów kont InstagramWitam. Konieczne jest przeprowadzenie wstępnej oceny możliwości realizacji następującego zadania. Posiadam listę kont na Instagramie. Celem jest uzyskanie danych kontaktowych (w pierwszej kolejności adresów e-mail) użytkowników, którzy obserwują te konta. Wcześniej spotkałem… Parsowanie danych ∙ 7 dni 8 godzin temu ∙ 13 ofert |